Sonderzeichen
Manecke, Mathias
l8101_02 at dbl-s2.dbl.ddb.de
Mo Okt 12 19:16:34 CEST 1998
Liebe Liste,
obwohl z. Z. nicht damit beschaeftigt (und deshalb nicht so ganz
gruendlich) moechte ich kurz? auf die Sonderzeichen-Diskussion
eingehen, da sie doch eines _der_ Themen des Buch- und
_Schrift_museums ist.
Kollege Allers:
> Angesichts der Klemme, in der wir uns, ja nicht erst jetzt,
> sehen, m"ochte ich die folgende Liste von Zeichen, die wir
> hier brauchen (T"urkei, Rum"anien, portugiesische Sprache),
> nicht als_Forderung_, sondern nur als (bestimmt nicht
> abschlie"ssende, sondern lediglich den momentanen Stand
> widerspiegelnde) _Bestandsaufnahme_ verstanden wissen.
Das ist genau das Dilemma: Schon aus der Sicht von drei
"entlegenen" Sprachen kommen schnell 9 Wuensche fuer zusaetzliche
Sonderzeichenbelegungen zusammen. Andere Sprachen, andere Blickwinkel
erfordern weitere. Wir haben derzeit in unserer Protypenliste etwas
ueber 200 Sonderzeichen stehen. Natuerlich will nicht jeder - wie wir
bei der Beschreibung muasealer Buecher - die Ligatur ae von der
Buchstabenkombination ae unterscheiden, nicht jeder braucht das
islaendische Thorn oder die Unterscheidung zwischen "u = ue und "u =
u mit Trema. Aber viele brauchen vieles und vor allem verschiedenes.
Da ist der OSTWEST-Font schon ein sehr guter Kompromiss. Dennoch
glaube ich, dass es nicht moeglich ist, eine sinnvolle Schnittmenge von
ca. 250 unterscheidbaren Zeichen fuer bibliographische Datenbanken zu
definieren. Insofern moechte ich Herrn Eversberg etwas widersprechen:
> Man vergesse nicht, dass ein Katalog ein Mittel zum Zweck ist, ein
> Hilfsmittel zum Auffinden, kein Instrument, mit dem man jeder Sprache die
> ihr gebuehrende Pflege angedeihen lassen kann. Dazu sind die Publikationen
> selbst da, und fuer Textspeicherung ist UNICODE auch gedacht, nicht fuer
> Datenbanken. Der normale Nutzer vergisst den Katalog sofort in dem Moment,
> wo er das Dokument in der Hand oder auf dem Schirm hat.
Zumindest fuer zwei Anwendungsgebiete, fuer die wir allegro
miss/ge?brauchen, wuerde ich das nicht unterschreiben: fuer die
Bibliographieproduktion und fuer die Anwendung als
Faktenrecherchesystem. Wir sind durch 500 Jahre Bleisatz so
verwoehnt, dass wir erwarten, dass in einem gedruckten Buch lateinische
und griechische Buchstaben ebenso zusammentreffen duerfen, wie
polnische und spanische Sonderzeichen.
Dafuer waere eine UNICODE-Datenbank schon ein schoener Traum! Aber der
Einwand bezueglich des Aufwandes fuer die Register ist natuerlich
absolut berechtigt. Die Diskussion sollte ohnehin untersccheiden
zwischen der unterscheidbaren Speicherung aller Sonderzeichen (fuer
die ich auf jeden Fall plaedieren wuerde) und der Ausgabe fuer
Bildschirmanzeige, (Register-)zugriff und Weiterverarbeitung (z. B.
Ausdruck). Die drei letztgenannten Funktionen stellen
unterschiedliche Anforderungen. Waehrend bei der Bildschirmanzeige die
Beruecksichtigung moeglichst vieler Sonderzeichen wuenschenswert aber
nicht zwingend ist, sind die Zeichen fuer das Register zwingend auf
den Grundbuchstaben zu reduzieren, bei der Ausgabe fuer die
Weiterverarbeitung allerdings wiederum zwingend zu beruecksichtigen.
Deshalb haben wir bei uns folgenden Loesungsansatz gewaehlt: Fuer die
Bildschirmanzeige und fuer die Erfassung verwenden wir den
OSTWEST-Font. Ist ein Sonderzeichen im OSTWEST-Font nicht vorhanden,
so wird es als Protype eingegeben und am Bildschirm auf den Grundbuchstaben
reduziert angezeigt. Auch alle im OSTWEST-Font enthaltenen
Sonderzeichen (>ASCII 128) koennen als Protype gespeichert werden und
werden dann bei der Bildschirmanzeige umcodiert. Im Register wird
natuerlich alles auf den Grundbuchstaben reduziert. Beim Export werden
_alle_ Sonderzeichen als Protypen ausgegeben. Der Rest ist Sache der
Weiterverarbeitung und programmabhaengig. Wir machens mit Winword und
einem Makro, welches an Hand der Protypentabelle alle Protypen in das
jeweils richtige Sonderzeichen umwandelt. Wenn hier die richtigen
Schriften zur Verfuegung stehen, geht im Prinzip alles.
Der Vorteil an diesem Verfahren ist, dass in den Umcodiertabellen
immer nur so viel drinn stehen muss, wie wirklich verwendet wird,
und das System dennoch nahezu unbegrenzt erweiterbar ist. Der
Nachteil ist, dass eine ganze Menge Parametrierung notwendig war (die
zum Glueck Herr Berger fuer uns erledigte und ich nach wie vor nicht
vollstaendig durchschaut habe;-)
Vielleicht kann ja, wenn an der Weiterentwicklung gefeilt wird, ein
wenig in diese Richtung gedacht werden. Warum sollte es nicht
mal eine allegro-Version geben, die automatisch aus "ü" bei der
Bildschirmanzeige "u und im Register ue macht?
Natuerlich gehoert das nicht zu den top ten auf der Prioritaetenliste.
Mathias Manecke
Die Deutsche Bibliothek
Deutsche Buecherei Leipzig
Deutsches Buch- und Schriftmuseum
Deutscher Platz
04103 Leipzig
manecke at dbl.ddb.de
Tel. 0341/2271-575
Mehr Informationen über die Mailingliste Allegro