Anzeige der Sonderzeichen im Internet

Matthias Kaun kaun at sbb.spk-berlin.de
Fr Aug 9 09:03:29 CEST 2002


Lieber Herr Eversberg, lieber Herr Berger,
auch ich habe so meine Schwierigkeiten mit Unicode/UTF-8, habe aber dennoch
einmal den Versuch unternommen, solche DB zu erstellen (Produkt einer sehr
aufwendigen Konvertierung verschiedener DB).
Wir haben im CJK-Bereich ja enorme Schwierigkeiten, gerade was den
Zeichenvorrat in Unicode angeht und das Auffinden der Zeichen im Index. Um
die Indexeintraege chin. Werke (aus z.B. der VR und Taiwan) z.B. an einer
Stelle zusammenzufuehren, bedarf es der Einarbeitung verschiedener bereits
existierender Tabellen u.a. des Unicode-Konsortiums oder auch NACSIS
(Japan), die in der Tat maechtig und philologisch interessant sind. Eine
andere Variante waere eine "automatische" Doppelindexierung oder
Mehrfachindexierung.
>Ruecksichtnahme auf Anwender mit DOS 6 / Windows 3.11
>ist eine Sache, man darf das aber nicht zum Anlass
>nehmen, die EDV-Entwicklung der letzten 12 Jahre
>als irrelevant beiseite zu wischen.

Das sehe ich aehnlich, nur sind die Probleme gravierend; UTF-8 loest keine
Probleme, sondern schafft bei der Katalogisierung wegen des
unwahrscheinlichen Zeichenvorrats erheblich mehr Probleme. Ich hatte
Katalogisierung bisher als eine Art "Normierung" verstanden. Man einigte
sich auf Zeichen, die zur Verfuegung stehen und dieser Vorrat war begrenzt,
aber mehr oder minder eindeutig. Unicode/UTF-8 oeffnet da Tueren, die
vielleicht fuer die Katalogisierung besser verschlossen bleiben sollten.

>die Moeglichkeit, reine UTF-8 Datenbanken vernuenftig
>zu betreiben, waere ein gigantischer Fortschritt
>fuer allegro, der m.E. mittelfristig angepeilt
>werden muss.

Vielleicht verstehe ich ja nicht die Einzelheiten, aber mit Avanti und
einer Schnittstelle zur Katalogisierung Avanti/allegro kann ich hier
bereits UTF-8 in eine DB eingeben und die normalen Skripte fuer die online
Kataloge geben mir und den Benutzern diese auch wunderbar wieder aus. 
Voraussetzung ist I.E. ein Unicode-Font und fuer unsere
originalschriftliche Eingabe jap, chin. Zeichen Microsoft IME (oder global
IME), das wunderbar funktioniert. Das man das unter DOS nicht mehr lesen
kann (also alles ueber Code 128) ist wohl einleuchtend, aber doch nicht
entscheidend, wenn man sich anderer Schnittstellen bemueht.

Schoenen Gruss
Matthias Kaun





Mehr Informationen über die Mailingliste Allegro