AW: [Allegro] Umwandlung UTF-8 -> Entitaetencodes
Thomas Fischer
fischer at sub.uni-goettingen.de
Fr Mär 20 11:47:39 CET 2009
Hallo Herr Eversberg,
> Wer intern mit UTF-8 arbeitet, hat's nicht leicht.
> Mit den P- und Q-Befehlen kann man zwar eine Anzahl von
> UTF-Codes auf Entitäten der Form \uE? umcodieren,
Warum sollte man das tun?
> die dann
> wenigstens im Anzeigefeld "korrekt" sichtbar werden,
das wird UTF-8 mit dem Anzeigemodul ohne jede Umkodierung (soweit der
Zeichenvorrat des benutzten Fonts reicht).
> wenn schon nicht im
> Auswahl- und Schreibfeld (wo es einfach technisch nicht geht).
> Allzuviele P-Befehle kann man aber nicht haben, dann fliegt
> es einem um die Ohren wegen Speichermangel. Für's Chinesische
> ist die Methode hoffnungslos.
> Kollege Allers kam auf die zündende Idee, man könne doch
> sicher in einem Unterprogramm automatisch aus den UTF-Codes
> die Entitätennummern errechnen und dann wahlweise diese
> Nummer zwischen \u...? oder für HTML zwischen &#...; einschließen.
Für HTML ist diese Umkodierung eigentlich auch nicht nötig, wenn man
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8">
setzt.
Die einzige Umkodierung, die ich benutze ist eine Reduktion UTF-8 -> ASCII
für Indexeinträge, die sortierfähig sein sollen.
Mit freundlichen Grüßen
Thomas Fischer
Mehr Informationen über die Mailingliste Allegro