[Allegro] Umsetzungstabellen ANSI OSTWEST: Zusammenfassung

Thomas Fischer fischer at sub.uni-goettingen.de
Do Jul 2 12:54:46 CEST 2009


Hallo Herr Eversberg, 

ich hatte eine einfache und klare Frage stellen wollen:
Wo finde ich die Tabellen für den Export in UTF-8 und HTML sowie die
Reduktions-Tabellen für die Registereinträge, wenn ich meine Datenbank im
ANSI-OstWest-Zeichensatz anlege.
Offenbar war das doch nicht so einfach...

Ich fasse hier einmal zusammen, was ich gestern gelernt habe.

1. Klar muss sein, was mit "ANSI-OstWest-Zeichensatz" gemeint ist: der
Zeichensatz, der in A99 in Zusammenhang mit den Allegro-Truetype-Schriften
benutzt wird, *NICHT* der OstWest-Zeichensatz auf DOS-Basis. Dieser
Zeichensatz wird intern typischerweise "ANSI" genannt.

2.
a) Exporttabellen nach HTML (also in Entitäten der Art ü oder
Zahlencodes ü) existieren nicht.

b) Die Exporttabelle nach UTF-8 heißt d-utf8.npt (nicht zu verwechseln mit
d-utf8.apt!) und kann auch für den Export nach XML benutzt werden, wenn
p & "&"
p < "<"
p > ">"
q > ">"
ergänzt werden.
Um damit Kombinationsbuchstaben korrekt darzustellen, muss zusätzlich in den
entsprechenden Exportparametern
pa=136 145 149 150 161 166 168 171 173 175 179 180 184 186 191 215 227 247 
und der Befehl
#da
gesetzt werden.

Wenn man das so vorbereitet hat, sollte für das *Anzeigefeld* wegen des
beschränkten Zeichenvorrats dann nicht mehr die ANSI-OstWest-Schrift benutzt
werden, sondern einer der Unicodefähigen Windows-Standardzeichensätze. Damit
UTF-8 dargestellt wird, muss der RTF-Kopf mit '{\urtf1...' statt mit
'{\rtf1...' beginnen.

Damit bekommt man dann
Identitás Kisebbségkutató Mu?helyo?l
korrekt angezeigt (ich hoffe, die Zeile übersteht den Mail-Transport).
Auch
Istraživanje
kommt mit "Arial Unicode MS" korrekt, nicht aber mit "Times New Roman".
Ob die Browser das korrekt hinbekommen, ist eine andere Frage; wer will kann
testen:
http://www.mathguide.de/cgi-bin/ssgfi/anzeige.pl?db=finug&nr=000198&ew=SSGFI
Bei dem Firefox kommt z.B. das 'ž' besser heraus, wenn es in der Datenbank
in einem Zeichen kodiert ist, bei Safari mach das keinen Unterschied.

c) Weil die Präsentation mit UTF-8 im Internet und im Anzeigefeld von A99
funktioniert bin ich der Konversion nach RTF nicht weiter nachgegangen.

d) Die Tabellen zur Erzeugung der Registereinträge muss ich mir noch
ansehen.

Mit freundlichen Grüßen
Thomas Fischer 




Mehr Informationen über die Mailingliste Allegro