Sonderzeichen

Michael Lackhoff lackhof at uni-muenster.de
Fr Okt 9 18:01:48 CEST 1998


On 9 Oct 98,, Bernhard Eversberg wrote:
 
> Aufruf zum Pragmatismus!

Dies u.a. in der Antwort auf den Gedanken, den Herr Allers und ich mal auf 
einem Seminar besprochen haben (Bonn, WWW?).

> > Vorschl"age, Anregungen? Ich habe das allerdings nicht zu
> > Ende gedachte Gef"uhl, da"ss uns Umcodierungstabellen helfen
> > w"urden, die Umschl"usselung _zweistelliger_ Zeichensequenzen
> > erlauben.

Ich bin auch zwischen diesen beiden Polen hin- und hergerissen. Einerseits 
denke ich schon, dass es Moeglichkeiten gibt, ueber zweistellige Codes einen 
viel groessen Zeichenvorrat zur Verfuegung zu stellen. Andererseits sehe ich 
aber auch, dass die Entwicklungsabteilung momentan andere Schwerpunkte 
setzt - und dies sicher aus gutem Grund.

Da Herr Allers mich gebeten hat, moechte ich kurz sagen, wie ich mir diese 
Codes vorstelle - oder besser, woher ich die Anregung bekam.

Genaugenommen sind es drei Quellen: 1. Die bibliothekarische Praxis / Norm. 
Diakritische Zeichen, fuer die kein kombiniertes Zeichen zur Verfuegung steht, 
werden als zwei Zeichen eingegeben (Grundbuchstabe + diakrit. Zeichen)
2. Die Prototypersetzungen in der Importsprache und 3. der sogenannte "Beta-
Code", der haeufig benutzt wird, um altgriechische Texte gar in 7(!) bit ASCII 
unterzubringen. Durch die Unmenge der Akzent- und Spirituskombinationen 
kommt man da sonst auch nicht hin. Wen es interessiert, die CD-ROMs 
"Thesaurus Linguae Graecae (TLG)" und die des Packard Humanities Institute 
(PHI) sind so kodiert, das Format auf der TLG Home Page dokumentiert.

Eine solche Kodierung hat verschiedene Vorteile. Als Beispiel nehme man die 
deutschen Umlaute. So wie Herr Allers sie typischerweise 7-bit gerecht aufl"ost 
spart er Zeichen, ohne Eindeutigkeit zu verlieren, da ein " sonst nicht in der 
Mitte eines Wortes vorkommt.
Natuerlich habe ich gemogelt, denn bei einem Wort wie "ofter braucht es schon 
mehr "Intelligenz", die Funktion des " zu erkennen.
Es ist also anzustreben als kombinierende Akzentzeichen Zeichen(positionen) 
zu verwenden, die keine andere Bedeutung haben. (Unicode hat so etwas 
uebrigens auch - trotz des viel groesseren Zeichenvorrates reicht es wohl 
immer noch nicht).

Der Vorteil im Umfeld von allegro ist vielfaeltig. 1. gibt es die kombinierenden 
Zeichen schon im Ostwest-Font. 2. Kann man sie fuer den Index oder andere 
"low-level"-Exporte einfach ausblenden. Fuer Windows koennte man einen 
Zeichensatz machen, wie es ihn z.B. auch fuer den oben erwaehnten Beta-
Code gibt. Hier wird ueber Kerning-Paare dasselbe erreicht wie beim bisherigen 
allegro-Druck mittels Backspace-Codes: die eigentlich zwei Zeichen werden so 
uebereinandergelegt, dass sie wie ein kombiniertes Zeichen erscheinen.

Je nach Faehigkeiten des verarbeitenden Programms/Geraetes und dessen 
Zeichenvorrates wird also entweder nur der Grundbuchstabe, Grundbuchstabe 
und Akzentzeichen nebeneinander oder beide kombiniert ausgegeben.

Da schon fast alles da ist, braeuchte man allegroseitig wohl "nur" eine 
Prototypersetzung fuer den Export und ein oder zwei kombinierende 
Zeichensaetze. Vielleicht noch ein paar zusaetzliche unterstuetzende 
Massnahmen.
Sicher nicht unmoeglich aber ebenso sicher nicht "mal eben so auf die 
Schnelle" gemacht - also eine Frage der Prioritaeten.

Vielleicht kann man ein wenig von der Entwicklung der wichtigsten 
Scriptsprachen (Perl, Python, Tcl/Tk) abgucken. Dort wird die 
Zeichensatzproblematik als wichtig angesehen aber so ganz ueberzeugende 
Loesungen gibt es wohl auch noch nicht.

> Wenn man sich eine Datenbank mit UNICODE vorstellen will, das ist gut
> und schoen, aber in einem Index muss auch dann wieder alles auf 
> Grundbuchstaben zurueckgefuehrt werden, anders geht das wirklich nicht,
> und dann braeuchte man eine viel groessere Tabelle als bisher.

Inhaltlich stimme ich Ihnen vollkommen zu, befuerchte aber, dass es genauso 
sein wird wie mit Windows: Es wird nicht gefragt "Kann man schnell und 
effektiv damit katalogisieren/recherchieren?" sondern "Hat das Programm eine 
Windows-Oberflaeche?" Und ebenso: "Kann die Datenbank UNICODE?"

Also mein Wunsch zum Thema: nicht aus dem Auge verlieren und ansonsten 
mit dem von Herrn Eversberg geforderten Pragmatismus angehen.

Viele Gruesse
Michael Lackhoff


########################################################################
# Michael Lackhoff                     e-mail  lackhof at uni-muenster.de #
# Hoersterplatz 4                      Tel.    0251-4833257            #
# 48147 Muenster                       FAX     0251-4833275            #
# Hochschule der Franziskaner und Kapuziner in Muenster                #
########################################################################




Mehr Informationen über die Mailingliste Allegro