AW: [Allegro] Umwandlung UTF-8 -> Entitaetencodes

Thomas Fischer fischer at sub.uni-goettingen.de
Fr Mär 20 11:47:39 CET 2009


Hallo Herr Eversberg,

> Wer intern mit UTF-8 arbeitet, hat's nicht leicht.
> Mit den P- und Q-Befehlen kann man zwar eine Anzahl von 
> UTF-Codes auf Entitäten der Form  \uE?  umcodieren,

Warum sollte man das tun?

> die dann 
> wenigstens im Anzeigefeld "korrekt" sichtbar werden,

das wird UTF-8 mit dem Anzeigemodul ohne jede Umkodierung (soweit der
Zeichenvorrat des benutzten Fonts reicht).

 > wenn schon nicht im
> Auswahl- und Schreibfeld (wo es einfach technisch nicht geht).

> Allzuviele P-Befehle kann man aber nicht haben, dann fliegt 
> es einem um die Ohren wegen Speichermangel. Für's Chinesische 
> ist die Methode hoffnungslos.
> Kollege Allers kam auf die zündende Idee, man könne doch 
> sicher in einem Unterprogramm automatisch aus den UTF-Codes 
> die Entitätennummern errechnen und dann wahlweise diese 
> Nummer zwischen \u...?  oder für HTML zwischen  &#...;  einschließen.

Für HTML ist diese Umkodierung eigentlich auch nicht nötig, wenn man 
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8">
setzt.

Die einzige Umkodierung, die ich benutze ist eine Reduktion UTF-8 -> ASCII
für Indexeinträge, die sortierfähig sein sollen.

Mit freundlichen Grüßen
Thomas Fischer 




Mehr Informationen über die Mailingliste Allegro