AW: [Allegro] UTF-8 zum zweiten

Thomas Berger ThB at Gymel.com
Fr Jul 1 23:10:56 CEST 2005


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Hallo Herr Wolf,

> ich muß nochmal nachfragen bezüglich
> 
> "UTF-8 funktioniert mit RTF nicht".
> 
> Aber warum funktioniert dann die Darstellung jeweils einer
> (Teil-)Codierung wie hebräisch, griechisch, chinesisch GB oder
> chinesisch BIG5 wenn man
> 
> a. die 'o.apt' leer macht und
> b. in die 'disphead.rtf' die entsprechenden Fonts 'David' für hebräisch,
> 'UT Greek traditional Courier' für griechisch, 'TSC U Fangsong' für GB
> und 'TSC U Ming' für BIG5
> 
> und zwar völlig ohne Hilfsprogramm also ohne Twinbridge, NJStar usw.
> Lediglich unter Zuhilfenahme der bei WinXP mitgelieferten IMEs ?

es gibt einen \fcharset-Befehl in der Fonttabelle von RTF-Dateien,
der angibt, in welchem Character Set der Font codiert ist. Natuerlich
gibt es auch Character Sets mit mehr als 256 Zeichen.
\fcharset136 ist z.B. fuer einen BIG5-Font anzugeben, das ist dann
so zu verstehen, dass im Text \'nnnn dann die Zeichenposition in
BIG5-codierung angibt. Es gibt jedoch keinen hier angebbaren Wert,
der den Font als "Unicode-Codiert" deklarieren wuerde (Unicode ist
auch kein "Character Set"). Fuer Unicode ist eben nicht \'nnnn,
sondern \unnnnXYZ anzugeben, wobei nnnn die dezimale Unicode-
Zeichennummer ist und XYZ eine Alternativzeichenkette, die so lang
ist, wie ein voriger \ucN-Befehl spezifiziert hat.


> Und auch Janas bzw. irgendein Web Explorer benötigen schliesslich einen
> Font und ich kann meine mit den mitgelieferten IMEs eingegebenen Daten
> tatsächlich korrekt sehen und weiterbearbeiten und zwar auch wenn ich
> ein und diesselbe allegro Kategorie chinesisch und hebräisch usw.
> mische.

Da ist der Fall ein ganz anderer: Diese Programme repraesentieren
intern alles sowieso in Unicode. Und fuer gewisse Code-Abschnitte
kann man hineinkonfigurieren, welcher Font dafuer zustaendig sind.
Und vor allem: UTF8 ist fuer Web-Browser eine der Standard-Codierungen.

Alle "normalen" Fonts in Windows-Systemen haben ausser ihrer/ihren
konkreten Codierung(en) auch noch ein Mapping von Unicode hinterlegt,
d.h. auf Seiten der Anwendung ist das keine besondere Zauberei.


> Es scheint also an dem für a99 verwendeten RTF zu liegen (Nachfrage an
> Herrn Berger) ? 

Nein, es liegt an RTF als solchem. Mit a99 bzw. a99 auf konkreten
Plattformen hat es nur insofern zu tun, als dass \unnn dort entweder
bereits funktioniert oder nicht.

viele Gruesse
Thomas Berger
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.3-nr1 (Windows XP)
Comment: Using GnuPG with Thunderbird - http://enigmail.mozdev.org

iD8DBQFCxbFgENVh3bB0lwMRAoAPAJ4uLMvBVYvP+7pv5DFEgaFqr8XDFACg0J5X
+h+rUJCuwtGh6u13z4CCov8=
=F3hi
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro