Zur Zeichensatzfrage

Bernhard Eversberg EV at buch.biblio.etc.tu-bs.de
Do Dez 21 14:36:02 CET 2000


Ergaenzend zu den Bemerkungen von Allers und Berger:

Unter DOS gab es keine Wahl: man musste sich auf eine Codepage
einigen und die Wahl fiel auf 437, die dann erweitert wurde.
Warum nicht 850? Das begruendet Anhang E des Handbuchs.

Solange wir die 1:1-Umcodierung zwischen DOS und Windows brauchen, 
haben wir keine Wahl, da muss es eine Codetabelle mit den 
entsprechenden Zeichen geben, und die haben wir dann in drei 
verschiedenen TTFs implementiert.

Will man, wie es WinWord macht, ein internes Umschalten zwischen 
mehreren Codepages ermoeglichen, muss man die Korrespondenz zwischen 
sichtbaren und gespeicherten Zeichen aufgeben, die es jetzt noch 
gibt. Zu einem Sonderzeichen gehoert dann mehr als ein gespeichertes 
Zeichen. Bei einem Textsystem ist das zwar nicht leicht, aber 
loesbar. In einem Datenbanksystem muss man immer die Indexierung mit
bedenken! Und da ist es ja so, dass wir zum Umcodieren eine Tabelle
mit 256 Codes haben - mehr geht nicht. Eine Zuordnung eines aus 
mehreren Bytes bestehenden Sonderzeichens zu einem Indexzeichen - wie 
soll das gehen? Da waeren aeusserst tiefe Eingriffe vonnoeten, die 
sich nicht zuletzt auf die Effizienz auswirken wuerden. Die .APT-
Dateien fuer die Umcodierung wuerden stark expandieren und 
komplizierter werden.
Denn eins ist klar: Im Index braucht man Grundbuchstaben. Darauf 
muessen alle Akzentbuchstaben abgebildet werden, sonst erhaelt man 
keine plausible Sortierung, denn die Sprachen haben sehr 
unterschiedliche Gepflogenheiten, die man nicht in ein und demselben 
Index alle nachvollziehen koennte (ich verweise auf meine Umlautstudie
   http://www.biblio.tu-bs.de/allegro/formate/umlaut.htm
mit dem Anhang der nationalen Besonderheiten.)

Meine persoenliche Meinung: Ein Katalog ist ein Hilfsmittel, das ein
schnelles, sicheres Auffinden von Materialien ermoeglichen soll. Kein 
Vehikel, um den diversen Sprachen Reverenz zu erweisen. Beides 
zugleich zu wollen, heisst ein anderes System wollen, und zwar ein
wesentlich komplexeres als "allegro", das ja eh schon immer fuer zu
komplex gehalten wird.

MfG B.E.

Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329, 
D-38023 Braunschweig, Germany
Tel.  +49 531 391-5026 , -5011 , FAX  -5836
e-mail  B.Eversberg at tu-bs.de  




Mehr Informationen über die Mailingliste Allegro