Sonderzeichen

Mo Okt 12 19:16:34 CEST 1998

Liebe Liste,

obwohl z. Z. nicht damit beschaeftigt (und deshalb nicht so ganz 
gruendlich) moechte ich kurz? auf die  Sonderzeichen-Diskussion 
eingehen, da sie doch eines _der_ Themen des Buch- und 
_Schrift_museums ist.

Kollege Allers:
> Angesichts der Klemme, in der wir uns, ja nicht erst jetzt,
> sehen, m"ochte ich die folgende Liste von Zeichen, die wir 
> hier brauchen (T"urkei, Rum"anien, portugiesische Sprache), 
> nicht als_Forderung_, sondern nur als (bestimmt nicht 
> abschlie"ssende, sondern lediglich den momentanen Stand 
> widerspiegelnde) _Bestandsaufnahme_ verstanden wissen.

Das ist genau das Dilemma: Schon aus der Sicht von drei 
"entlegenen" Sprachen kommen schnell 9 Wuensche fuer zusaetzliche 
Sonderzeichenbelegungen zusammen. Andere Sprachen, andere Blickwinkel 
erfordern weitere. Wir haben derzeit in unserer Protypenliste etwas 
ueber 200 Sonderzeichen stehen. Natuerlich will nicht jeder - wie wir 
bei der Beschreibung muasealer Buecher - die Ligatur ae von der 
Buchstabenkombination ae unterscheiden, nicht jeder braucht das 
islaendische Thorn oder die Unterscheidung zwischen "u = ue und "u = 
u mit Trema. Aber viele brauchen vieles und vor allem verschiedenes. 
Da ist der OSTWEST-Font schon ein sehr guter Kompromiss. Dennoch 
glaube ich, dass es nicht moeglich ist, eine sinnvolle Schnittmenge von 
ca. 250 unterscheidbaren Zeichen fuer bibliographische Datenbanken zu 
definieren. Insofern moechte ich Herrn Eversberg etwas widersprechen:

> Man vergesse nicht, dass ein Katalog ein Mittel zum Zweck ist, ein
> Hilfsmittel zum Auffinden, kein Instrument, mit dem man jeder Sprache die
> ihr gebuehrende Pflege angedeihen lassen kann. Dazu sind die Publikationen
> selbst da, und fuer Textspeicherung ist UNICODE auch gedacht, nicht fuer
> Datenbanken. Der normale Nutzer vergisst den Katalog sofort in dem Moment,
> wo er das Dokument in der Hand oder auf dem Schirm hat.

Zumindest fuer zwei Anwendungsgebiete, fuer die wir allegro 
miss/ge?brauchen, wuerde ich das nicht unterschreiben: fuer die 
Bibliographieproduktion und fuer die Anwendung als 
Faktenrecherchesystem. Wir sind durch 500 Jahre Bleisatz so 
verwoehnt, dass wir erwarten, dass in einem gedruckten Buch lateinische 
und griechische Buchstaben ebenso zusammentreffen duerfen, wie 
polnische und spanische Sonderzeichen. 
Dafuer waere eine UNICODE-Datenbank schon ein schoener Traum! Aber der 
Einwand bezueglich des Aufwandes fuer die Register ist natuerlich 
absolut berechtigt. Die Diskussion sollte ohnehin untersccheiden 
zwischen der unterscheidbaren Speicherung aller Sonderzeichen (fuer 
die ich auf jeden Fall plaedieren wuerde) und der Ausgabe fuer 
Bildschirmanzeige, (Register-)zugriff und Weiterverarbeitung (z. B. 
Ausdruck). Die drei letztgenannten Funktionen stellen 
unterschiedliche Anforderungen. Waehrend bei der Bildschirmanzeige die 
Beruecksichtigung moeglichst vieler Sonderzeichen wuenschenswert aber 
nicht zwingend ist, sind die Zeichen fuer das Register zwingend auf 
den Grundbuchstaben zu reduzieren, bei der Ausgabe fuer die 
Weiterverarbeitung allerdings wiederum zwingend zu beruecksichtigen.

Deshalb haben wir bei uns folgenden Loesungsansatz gewaehlt: Fuer die 
Bildschirmanzeige und fuer die Erfassung verwenden wir den 
OSTWEST-Font. Ist ein Sonderzeichen im OSTWEST-Font nicht vorhanden, 
so wird es als Protype eingegeben und am Bildschirm auf den Grundbuchstaben 
reduziert angezeigt. Auch alle im OSTWEST-Font enthaltenen 
Sonderzeichen (>ASCII 128) koennen als Protype gespeichert werden und 
werden dann bei der Bildschirmanzeige umcodiert. Im Register wird 
natuerlich alles auf den Grundbuchstaben reduziert. Beim Export werden 
_alle_ Sonderzeichen als Protypen ausgegeben. Der Rest ist Sache der 
Weiterverarbeitung und programmabhaengig. Wir machens mit Winword und 
einem Makro, welches an Hand der Protypentabelle alle Protypen in das 
jeweils richtige Sonderzeichen umwandelt. Wenn hier die richtigen 
Schriften zur Verfuegung stehen, geht im Prinzip alles. 
Der Vorteil an diesem Verfahren ist, dass in den Umcodiertabellen 
immer nur so viel drinn stehen muss, wie wirklich verwendet wird, 
und das System dennoch nahezu unbegrenzt erweiterbar ist. Der 
Nachteil ist, dass eine ganze Menge Parametrierung notwendig war (die 
zum Glueck Herr Berger fuer uns erledigte und ich nach wie vor nicht 
vollstaendig durchschaut habe;-) 

Vielleicht kann ja, wenn an der Weiterentwicklung gefeilt wird, ein 
wenig in diese Richtung gedacht werden. Warum sollte es nicht 
mal eine allegro-Version geben, die automatisch aus "ü" bei der 
Bildschirmanzeige "u und im Register ue macht?

Natuerlich gehoert das nicht zu den top ten auf der Prioritaetenliste.

Mathias Manecke
Die Deutsche Bibliothek
Deutsche Buecherei Leipzig
Deutsches Buch- und Schriftmuseum
Deutscher Platz
04103 Leipzig
manecke at dbl.ddb.de
Tel. 0341/2271-575