Zur Zeichensatzfrage
Thomas Berger
ThB.com at t-online.de
Do Dez 21 19:28:41 CET 2000
Lieber Herr Habisch,
> Hat vielleicht schon jemand eine Ersetzungstabelle vom Allegro-Zeichensatz
> (ostwest.fon) nach UTF-8 begonnen oder gar fertiggestellt ?
>
> Ich würde gerne die DIN 31628-2 -konformen Diakritika per Exporttabelle in
> UTF-8 Zeichen umwandeln, um baltische, finno-ugrische und slawische
> Sonderzeichen in einem WWW-Katalog darstellen zu können.
Auf der Seite
http://www.gymel.com/charsets/crosstabs.html
finden Sie unten (von allegro nach ... Unicode)
einen Link auf eine Tabelle mit Rohmaterial fuer diesen
Zweck: ca. 820 Unicode-Zeichen koennen durch Praefix-
Kompositionen aus dem Ostwest-Zeichensatz getroffen
werden. Es sind natuerlich zwei- und Dreizeichen-
Kombinationen dabei, die meisten Zielzeichen in
UTF-8 haben natuerlich auch mehr als ein Byte.
Insofern muessen Sie hier mit einer Kaskade von
globalen Ersetzungen (vielschrittig oder durch ein
cleveres Rateprogramm optimieren lassen!) arbeiten
oder die Zeichen erst nach dem Export aus allegro
mit externen Mitteln konvertieren.
viele Gruesse
Thomas Berger
Mehr Informationen über die Mailingliste Allegro