Zur Zeichensatzfrage

Do Dez 21 16:01:33 CET 2000

Lieber Herr Eversberg,

> mit 256 Codes haben - mehr geht nicht. Eine Zuordnung eines aus
> mehreren Bytes bestehenden Sonderzeichens zu einem Indexzeichen - wie
> soll das gehen? Da waeren aeusserst tiefe Eingriffe vonnoeten, die
> sich nicht zuletzt auf die Effizienz auswirken wuerden. Die .APT-
> Dateien fuer die Umcodierung wuerden stark expandieren und
> komplizierter werden.

Hier muss ich widersprechen: Die allegro-Importsprache kennt
z.B. die sehr nuetzlichen Protyp-Ersetzungen. Die Exportsprache
hingegen kennt nur eine Backspace-Liste und die Umcodierungen
"p x 2/3/5" sowie die (kniffligen und ebenfalls als ineffizient
eingestuften) globalen Ersetzungen.

Keine Erweiterung (und eine Erweiterung wird irgendwann
zwangslaeufig sein) wird wohl so aussehen, dass die diversen
derzeit vorhandenen Tabellen von 255 Eintraegen auf je
65536 Eintraege erweitert werden. Vielmehr wird man stets
auf Listen von Regeln umsteigen, die natuerlich evtl.
geschickt sortiert sind. Ich bin eigentlich ziemlich
zuversichtlich, dass sich eine rudimentaere UTF-8-
Unterstuetzung selbst noch in den DOS-Programmen 
unterbringen liesse und vorhandene Umcodierungstabellen
maschinell auf eine neue Syntax umgestellt werden 
koennten (falls das ueberhaupt notwendig sein sollte).
Erweiterungen der Tabellen auf die paar zusaetzlichen
Zeichen, die man schon immer einmal haben wollte, wuerden
dann peu a peu erfolgen.

Immerhin ist es ja so, dass man fuer die Masse der
Unicode-Zeichen (also alles bis auf die paarhundert
mit lateinischen Grundbuchstaben) sowieso nichts
Sinnvolles tun kann, denn eine automatische 
Transliteration von asiatischen Zeichen in lateinische
Kleinbuchstaben fuer den Index erwarte ich von keinem
System.

viele Gruesse
Thomas Berger