AW: AW: [Allegro] Das Neutralmodell - Eine Projektidee

Kaun, Matthias Matthias.Kaun at sbb.spk-berlin.de
Di Nov 22 13:05:30 CET 2005


Lieber Herr Eversberg,
> Ich finde, für Unicode müsste auch eine Lösung gefunden werden.
 > Ich habe noch nicht verstanden, wie die Spezialisten mit chinesischen
> Zeichensätzen umgehen,
>>Da kommt kein Unicode zum Einsatz! Big5 etc. sind anders konzipiert.

Das ist differenziert zu betrachten. Fuer VR China gilt GB2312 als Standard, der zusammen mit ChinaMARC Anwendung findet.
Fuer Japan gelten JIS oder Shift-JIS als Standard, in Taiwan wird in der Regel Big-5 angewandt. Nichtsdestotrotz bieten japanische Bibliotheken ihre Daten auch in UTF-8 an (MARC21). Das Gleiche gilt auch fuer koreanische Bibliotheken.
Wenn ostasiatische Sammlungen, also chinesische, japanische und koreanische  Titel (und auch Titel in anderen Schriften) in einem gemeinsamen Katalog zur Verfuegung gestellt werden sollen, bleiben nur UTF-8/UTF-16 uebrig.

In der Ostasienabteilung nutzen wir Allegro. Die Katalogisierung erfolgt derzeit fuer das Chinesische mit GB2312, fuer das Japanische mit JIS; fuer westliche Schrift wird - wie ueblich -  ASCII genutzt. Durch Konvertierungsroutinen werden die Daten nach UTF-8 umkodiert (deutsche Umlaute, frz. Buchstaben - also alle Zeichen ueber 128 werden markiert und speziell aus der "gefaehrlichen" Zone (ueber ASCII 128) genommen, damit bei der Umkodierung nicht deutsche Umlaute falsch umkodiert werden.
Danach werden die verschiedenen umkodierten Allegro.*lg wieder in allegro indexiert und ueber das www/avanti zur Verfuegung gestellt. Allegro/Avanti kann - soweit ich das sehe, damit umgehen, nur kann ich eben presto oder a99 nicht nutzen. (http://ead.staatsbibliothek-berlin.de/cat/)


Wir arbeiten auch zur Zeit an einer Katalogisierungsschnittstelle fuer die direkte Eingabe in eine Allegro-Datenbank ueber ein www-interface. Auch hier funktionieren die ueblichen Indexierungsroutinen von Allegro.

Es waere in der Tat extrem wuenschenswert, wenn a99/allegro wirklich Unicode-faehig waeren. Ich denke, dass nicht nur wir als Randphaenomen des Bibliothekwesens an solch einer Loesung interessiert sind. Die Indexierung nach Vorlageform in der vorliegenden Schrift sollte nicht nur fuer den Bereich Ostasien oberste Prioritaet haben. Die pure Anzeige von Mehrschriftlichkeit waere nichts weiter als ein ziemlich teuer erkauftes feature. Das Retrieval in den vorliegenden Schriften ist aus meiner Sicht das Notwendige und wuerde auch - wenn auch mittelfristig - das Problem der unterschiedlichsten Transliterationen und Transkriptionen (und deren Anwendung) loesen koennen.

Schoenen Gruss
Matthias Kaun

Staatsbibliothek zu Berlin
Ostasienabteilung
http://ead.staatsbibliothek-berlin.de





Mehr Informationen über die Mailingliste Allegro