Zur Zeichensatzfrage
Bernhard Eversberg
EV at buch.biblio.etc.tu-bs.de
Do Dez 21 14:36:02 CET 2000
Ergaenzend zu den Bemerkungen von Allers und Berger:
Unter DOS gab es keine Wahl: man musste sich auf eine Codepage
einigen und die Wahl fiel auf 437, die dann erweitert wurde.
Warum nicht 850? Das begruendet Anhang E des Handbuchs.
Solange wir die 1:1-Umcodierung zwischen DOS und Windows brauchen,
haben wir keine Wahl, da muss es eine Codetabelle mit den
entsprechenden Zeichen geben, und die haben wir dann in drei
verschiedenen TTFs implementiert.
Will man, wie es WinWord macht, ein internes Umschalten zwischen
mehreren Codepages ermoeglichen, muss man die Korrespondenz zwischen
sichtbaren und gespeicherten Zeichen aufgeben, die es jetzt noch
gibt. Zu einem Sonderzeichen gehoert dann mehr als ein gespeichertes
Zeichen. Bei einem Textsystem ist das zwar nicht leicht, aber
loesbar. In einem Datenbanksystem muss man immer die Indexierung mit
bedenken! Und da ist es ja so, dass wir zum Umcodieren eine Tabelle
mit 256 Codes haben - mehr geht nicht. Eine Zuordnung eines aus
mehreren Bytes bestehenden Sonderzeichens zu einem Indexzeichen - wie
soll das gehen? Da waeren aeusserst tiefe Eingriffe vonnoeten, die
sich nicht zuletzt auf die Effizienz auswirken wuerden. Die .APT-
Dateien fuer die Umcodierung wuerden stark expandieren und
komplizierter werden.
Denn eins ist klar: Im Index braucht man Grundbuchstaben. Darauf
muessen alle Akzentbuchstaben abgebildet werden, sonst erhaelt man
keine plausible Sortierung, denn die Sprachen haben sehr
unterschiedliche Gepflogenheiten, die man nicht in ein und demselben
Index alle nachvollziehen koennte (ich verweise auf meine Umlautstudie
http://www.biblio.tu-bs.de/allegro/formate/umlaut.htm
mit dem Anhang der nationalen Besonderheiten.)
Meine persoenliche Meinung: Ein Katalog ist ein Hilfsmittel, das ein
schnelles, sicheres Auffinden von Materialien ermoeglichen soll. Kein
Vehikel, um den diversen Sprachen Reverenz zu erweisen. Beides
zugleich zu wollen, heisst ein anderes System wollen, und zwar ein
wesentlich komplexeres als "allegro", das ja eh schon immer fuer zu
komplex gehalten wird.
MfG B.E.
Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329,
D-38023 Braunschweig, Germany
Tel. +49 531 391-5026 , -5011 , FAX -5836
e-mail B.Eversberg at tu-bs.de
Mehr Informationen über die Mailingliste Allegro