[Allegro] Zeichenbelegung von in UTF-8 codierter Datenbank auswerten

Heinrich Allers allers at t-online.de
Mo Nov 19 10:49:19 CET 2012


Hallo allerseits:

ich habe dieser Tage eine rein in UTF-8 codierte Datenbank in die Hände bekommen und war neugierig 
zu erfahren, welche Zeichen oder Zeichenintervalle im Unicode-Spektrum (dez. 128 / hex. 0080 bis dez. 
65535 / hex. FFFF) mit welcher Häufigkeit besetzt sind.  

Habe da was gebastelt, was vielleicht auch andere Freunde von intern in UTF-8 codierten 
Allegro-Datenbanken interessieren mag:  

http://h-allers.de/temp/utf8cod.flx

Diese FLEX-Datei produziert eine 3-spaltige rtf-Datei, pro Zeichen eine Zeile:
- 1. Spalte: Häufigkeit des Zeichens in der Datenbank
- 2. Spalte: Entitätszahl (Unicode dez.)
- 3. Spalte: Visualisierung des Zeichens


Verbesserungs- und Erweiterungsvorschlägen gegenüber aufgeschlossen grüßt

Heinrich Allers

allers at t-online.de * http://www.h-allers.de
Netztagebuch: http://heinrich-erlo-ger.blogspot.com/
Bitácora: http://heinrich-erlo-spa.blogspot.com/
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20121119/87f98e1d/attachment.html>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : -
Dateityp    : application/octet-stream
Dateigröße  : 601 bytes
Beschreibung: Mail message body
URL         : <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20121119/87f98e1d/attachment.obj>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : WPM$YITR.PM$
Dateityp    : application/octet-stream
Dateigröße  : 353 bytes
Beschreibung: Nachrichtentext
URL         : <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20121119/87f98e1d/attachment-0001.obj>


Mehr Informationen über die Mailingliste Allegro