AW: [Allegro] Unicode (von Fwd: Re: .dat files)
Fischer, Thomas
fischer at sub.uni-goettingen.de
Do Apr 12 10:01:51 CEST 2012
Lieber Herr Allers,
ich warte schon seit langem auf eine Meldung, die in etwa der Webseite
http://wiki.allegro.cc/index.php?title=Allegro_unicode
entspricht. Und natürlich sind mir die Probleme von zweibytigen Zeichensätzen bewusst (ich habe selber noch einige C-Programme, bei denen ich mich vor Unicode gedrückt habe).
Allerdings denke ich, dass es einfach nicht mehr zeitgemäß ist, solche Hürden aufzubauen. Dass für die Kompilierung der Open-Source-Version von A99 Visual Studio 6 benötigt wird, wo ich gerade die Werbung "Visual Studio 11 Beta ist da!" bekommen habe, weist in dieselbe Richtung.
Die "Lösung", die Allegro mit dem OstWest-Font geboten hat, war zum Zeitpunkt ihrer Einführung wohl sehr nützlich, stößt mit zunehmend internationalen Beziehungen aber schnell an ihre Grenzen. Und so neu ist die Forderung ja auch nicht:
"Das BSZ hat im Jahr 2003 eine Ausschreibung und Auswahl für eine neue
Verbundsystemsoftware durchgeführt. Im Anforderungskatalog wurde bewusst
unter dem Punkt "Zeichensatz" die folgende Leistung gefordert:
"Als Zeichensatz muss UNICODE in der Erfassung, Speicherung und
Indexierung unterstützt werden, damit auch Daten z.B. aus
CJK-Bibliotheken im Verbundsystem erfasst und gehalten werden
können. Falls dies in der aktuellen Version der angebotenen
Software nicht im Leistungsumfang vorhanden ist, muss der
Anbieter ein verbindliches Migrationskonzept vorlegen.""
> Fischer setzt das Standard-Instrumentarium ein (mit P- und
> Q-Tabellen und so), um eine dreistellige Zahl von Zeichen im
> unteren Unicode-Bereich zu erschlagen, waehrend Lehmann ganz
> anders rangegangen ist und damit die 5-stellige Zahl von
> Zeichen des CJK-Bereichs zu erschlagen in der Lage war. Was
> Lehmann gewinnt durch seinen Ansatz, muss er freilich damit
> bezahlen, dass die Realisierung einer nennenswerten Zahl von
> Zeichen im unteren Unicode-Bereich mit ziemlichen
> Anstrengungen verbunden ist.
Bei mir hakt es im wesentlichen bei der Indexierung bzw. der Darstellung der Register unter A99, bei Darstellung durch den Browser habe ich keine Probleme (wer will, kann ja auf http://Guide.FinnUg.de/indexscan.html mal blättern).
Meine Methode ist, die Zeichen auf ASCII klein umzusetzen um so eine sortierfähige Liste zu bekommen, mit Herrn Eversbergs Korrektur von gestern sollte das jetzt auch funktionieren. Ob es für CJK solche Transkriptionen gibt, weiß ich nicht, die Aller-Lehmannsche Konstruktion, chinesische Zeichen im Register zu präsentieren, habe ich leider nie verstanden.
> Langer Rede kurzer Sinn: Wenn Allegro (hier: a99) etwas
> beitragen koennte, um diese Grenzen der genannten Loesungen
> weniger hemmend sein zu lassen, waere es schoen - aber mein
> Eindruck ist nach wie vor, dass es das Fehlen eines
> universalen UTF-8- (oder Unicode-) Fonts ist, der schoenen
> Allegro-a99-Loesungen im Wege steht, konkret: den Aufbau
> zeichensatzuebergreifender Register ausschliesst - kurzum,
> dass das Defizit also weniger bei Allegro als beim von
> Microsoft bereitgestellten Font-Management liegt.
Da der Browser alle Zeichen korrekt darstellt, kann ich mir eigentlich nicht vorstellen, dass das (bzw. mein) Problem bei dem Zeichensatz liegt, sondern sehe es eher bei A99.
Mit freundlichen Grüßen
Thomas Fischer
Mehr Informationen über die Mailingliste Allegro