[Allegro] Zeichenbelegung von in UTF-8 codierter Datenbank auswerten
Heinrich Allers
allers at t-online.de
Mo Nov 19 10:49:19 CET 2012
Hallo allerseits:
ich habe dieser Tage eine rein in UTF-8 codierte Datenbank in die Hände bekommen und war neugierig
zu erfahren, welche Zeichen oder Zeichenintervalle im Unicode-Spektrum (dez. 128 / hex. 0080 bis dez.
65535 / hex. FFFF) mit welcher Häufigkeit besetzt sind.
Habe da was gebastelt, was vielleicht auch andere Freunde von intern in UTF-8 codierten
Allegro-Datenbanken interessieren mag:
http://h-allers.de/temp/utf8cod.flx
Diese FLEX-Datei produziert eine 3-spaltige rtf-Datei, pro Zeichen eine Zeile:
- 1. Spalte: Häufigkeit des Zeichens in der Datenbank
- 2. Spalte: Entitätszahl (Unicode dez.)
- 3. Spalte: Visualisierung des Zeichens
Verbesserungs- und Erweiterungsvorschlägen gegenüber aufgeschlossen grüßt
Heinrich Allers
allers at t-online.de * http://www.h-allers.de
Netztagebuch: http://heinrich-erlo-ger.blogspot.com/
Bitácora: http://heinrich-erlo-spa.blogspot.com/
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20121119/87f98e1d/attachment.html>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : -
Dateityp : application/octet-stream
Dateigröße : 601 bytes
Beschreibung: Mail message body
URL : <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20121119/87f98e1d/attachment.obj>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : WPM$YITR.PM$
Dateityp : application/octet-stream
Dateigröße : 353 bytes
Beschreibung: Nachrichtentext
URL : <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20121119/87f98e1d/attachment-0001.obj>
Mehr Informationen über die Mailingliste Allegro