Sonderzeichen
Michael Lackhoff
lackhof at uni-muenster.de
Fr Okt 9 18:01:48 CEST 1998
On 9 Oct 98,, Bernhard Eversberg wrote:
> Aufruf zum Pragmatismus!
Dies u.a. in der Antwort auf den Gedanken, den Herr Allers und ich mal auf
einem Seminar besprochen haben (Bonn, WWW?).
> > Vorschl"age, Anregungen? Ich habe das allerdings nicht zu
> > Ende gedachte Gef"uhl, da"ss uns Umcodierungstabellen helfen
> > w"urden, die Umschl"usselung _zweistelliger_ Zeichensequenzen
> > erlauben.
Ich bin auch zwischen diesen beiden Polen hin- und hergerissen. Einerseits
denke ich schon, dass es Moeglichkeiten gibt, ueber zweistellige Codes einen
viel groessen Zeichenvorrat zur Verfuegung zu stellen. Andererseits sehe ich
aber auch, dass die Entwicklungsabteilung momentan andere Schwerpunkte
setzt - und dies sicher aus gutem Grund.
Da Herr Allers mich gebeten hat, moechte ich kurz sagen, wie ich mir diese
Codes vorstelle - oder besser, woher ich die Anregung bekam.
Genaugenommen sind es drei Quellen: 1. Die bibliothekarische Praxis / Norm.
Diakritische Zeichen, fuer die kein kombiniertes Zeichen zur Verfuegung steht,
werden als zwei Zeichen eingegeben (Grundbuchstabe + diakrit. Zeichen)
2. Die Prototypersetzungen in der Importsprache und 3. der sogenannte "Beta-
Code", der haeufig benutzt wird, um altgriechische Texte gar in 7(!) bit ASCII
unterzubringen. Durch die Unmenge der Akzent- und Spirituskombinationen
kommt man da sonst auch nicht hin. Wen es interessiert, die CD-ROMs
"Thesaurus Linguae Graecae (TLG)" und die des Packard Humanities Institute
(PHI) sind so kodiert, das Format auf der TLG Home Page dokumentiert.
Eine solche Kodierung hat verschiedene Vorteile. Als Beispiel nehme man die
deutschen Umlaute. So wie Herr Allers sie typischerweise 7-bit gerecht aufl"ost
spart er Zeichen, ohne Eindeutigkeit zu verlieren, da ein " sonst nicht in der
Mitte eines Wortes vorkommt.
Natuerlich habe ich gemogelt, denn bei einem Wort wie "ofter braucht es schon
mehr "Intelligenz", die Funktion des " zu erkennen.
Es ist also anzustreben als kombinierende Akzentzeichen Zeichen(positionen)
zu verwenden, die keine andere Bedeutung haben. (Unicode hat so etwas
uebrigens auch - trotz des viel groesseren Zeichenvorrates reicht es wohl
immer noch nicht).
Der Vorteil im Umfeld von allegro ist vielfaeltig. 1. gibt es die kombinierenden
Zeichen schon im Ostwest-Font. 2. Kann man sie fuer den Index oder andere
"low-level"-Exporte einfach ausblenden. Fuer Windows koennte man einen
Zeichensatz machen, wie es ihn z.B. auch fuer den oben erwaehnten Beta-
Code gibt. Hier wird ueber Kerning-Paare dasselbe erreicht wie beim bisherigen
allegro-Druck mittels Backspace-Codes: die eigentlich zwei Zeichen werden so
uebereinandergelegt, dass sie wie ein kombiniertes Zeichen erscheinen.
Je nach Faehigkeiten des verarbeitenden Programms/Geraetes und dessen
Zeichenvorrates wird also entweder nur der Grundbuchstabe, Grundbuchstabe
und Akzentzeichen nebeneinander oder beide kombiniert ausgegeben.
Da schon fast alles da ist, braeuchte man allegroseitig wohl "nur" eine
Prototypersetzung fuer den Export und ein oder zwei kombinierende
Zeichensaetze. Vielleicht noch ein paar zusaetzliche unterstuetzende
Massnahmen.
Sicher nicht unmoeglich aber ebenso sicher nicht "mal eben so auf die
Schnelle" gemacht - also eine Frage der Prioritaeten.
Vielleicht kann man ein wenig von der Entwicklung der wichtigsten
Scriptsprachen (Perl, Python, Tcl/Tk) abgucken. Dort wird die
Zeichensatzproblematik als wichtig angesehen aber so ganz ueberzeugende
Loesungen gibt es wohl auch noch nicht.
> Wenn man sich eine Datenbank mit UNICODE vorstellen will, das ist gut
> und schoen, aber in einem Index muss auch dann wieder alles auf
> Grundbuchstaben zurueckgefuehrt werden, anders geht das wirklich nicht,
> und dann braeuchte man eine viel groessere Tabelle als bisher.
Inhaltlich stimme ich Ihnen vollkommen zu, befuerchte aber, dass es genauso
sein wird wie mit Windows: Es wird nicht gefragt "Kann man schnell und
effektiv damit katalogisieren/recherchieren?" sondern "Hat das Programm eine
Windows-Oberflaeche?" Und ebenso: "Kann die Datenbank UNICODE?"
Also mein Wunsch zum Thema: nicht aus dem Auge verlieren und ansonsten
mit dem von Herrn Eversberg geforderten Pragmatismus angehen.
Viele Gruesse
Michael Lackhoff
########################################################################
# Michael Lackhoff e-mail lackhof at uni-muenster.de #
# Hoersterplatz 4 Tel. 0251-4833257 #
# 48147 Muenster FAX 0251-4833275 #
# Hochschule der Franziskaner und Kapuziner in Muenster #
########################################################################
Mehr Informationen über die Mailingliste Allegro