Überführung von LIDOS =?iso-8859-1?Q?Da

Thomas Berger ThB.com at t-online.de
Do Jun 29 18:51:27 CEST 2000


Sehr geehrter Herr Balk,

Sie schrieben:

> es ist eine gute Nachricht, dass die Bibliotheken des Orient-Instituts
> der Deutschen Morgenlaendischen Gesellschaft in Beirut und Istanbul
> LIDOS durch ALLEGRO ersetzen werden. Bei den von Herrn Dr. Lemke
> erwaehnten Schwierigkkeiten handelt es sich offenbar wesentlich um die
> in der Datenbank verwendete Umschrift der Deutschen Morgenländischen
> Gesellschaft. Es ist dringend zu empfehlen, diese Umschrift nicht weiter
> zu verwenden.

...

> Ein weiterer Grund, von Sonderzeichen abzuraten, liegt darin, dass sie
> im allgemeinen nicht retrievalfaehig sind. Sie werden bei der Erstellung
> der Indices in der Regel herausgespielt und verlieren dadurch ihre
> distinktive Funktion. Im Falle des Arabischen liegt der Fall so, dass
> zur Wiedergabe der 28 Konsonanten des Alphabets von den 26 zur
> Verfuegung stehenden lateinischen Buchstaben nur 18 verwandt werden. In
> der DMG-Umschrift sieht das Alphabet naemlich so aus:
> 
> - b t t g h h d d r z s s s d t z - g f q k l m n h w y
> 
> Der erste und achtzehnte Buchstabe (Aliph und Ain) wird ueberhaupt nicht
> durch einen Buchstaben, sondern durch Apostroph und ein Spezialzeichen
> ausgedrueckt, das ich hier nicht schreiben kann. Die uebrigen Buchstaben

Hamzah und Ain sind aber recht beliebt, zumindest in allen
bibliothekarischen
Zeichensaetzen vorgesehen, d.h. ANSEL, Pica und MAB haben beide,
allegro-
ostwest fehlt das Alif [allegro-windows hat es wiederum, keine Ahnung
wie man das ausnutzen soll].


> sind diakritische Varianten der 18 Grundbuchstaben b t g h d r z s g f q
> k l m n h w y. Dies bedeutet, dass die Zugriffssicherheit
> (retrievability) in einem normalen Katalog bei lediglich 64 Prozent (18
> von 28) liegt. Ich kenne kein Transliterationssystem, bei dem dieses
> Verhaeltnis unguenstiger ist als im Arabischen.
> 
> Da die meisten orientalischen Schriften mehr Buchstaben aufweisen als
> das lateinische Alphabet, empfiehlt es sich, zum Zweck der
> Unterscheidung Buchstabenkombinationen zu verwenden. Dieses Verfahren
> ist selbstverstaendlicher Teil unserer Schifttradition (vgl. englisch ch
> th sh, deutsch ae oe ue sch, polnisch sz cz und so weiter). Das
> arabische Alphabet liesse sich zum Beispiel auch folgendermassen
> wiedergeben:

...

> Ich gebe zu, dass sich das etwas ungewoehnlich liest, aber das ist eine
> Frage der Gewohnheit (und auch nur ein Vorschlag). Aber immerhin erhaelt
> man eindeutige Stichwoerter und somit brauchbare Indexeintraege. Die
> DMG-Umschrift bietet dies, wie ausgefuehrt, nur eingeschraenkt. Nach
> meiner Ueberzeugung sollte man entweder Originalschriften oder
> Umschriften ohne Sonderzeichen verwenden.

Ich beherrsche weder arabisch, noch kenne ich die Umschrift der DMG
oder DIN 32635 mit der "verbindlichen" Transliteration nach RAK.
Daher bitte ich, mir meine unmassgeblichen Aeusserungen nachzusehen:

Nach meinen Vorstellungen sind Transliterationssysteme inzwischen
weitgehend international vereinheitlicht. Diakritika ueber den
Grundbuchstaben haben dabei gegenueber Buchstabenkombinationen
vermutlich den Vorteil der "Neutralitaet" gehabt: Denken Sie an
die unterschiedlichen Tran*skriptionen* Chaikovsky und Tschaikowski
je nach Land der Sprecher. International kann man sich da
eher auf einen Buchstaben mit Ueberstrich einigen (weiss ja niemand,
wie man das ausspricht) als auf Kombinationen mit unterschiedlichen
Aussprachepraeferenzen, auch wenn diese Kombinationen eindeutig
waeren, also eine Transliteration darstellten. [Mein Beispiel
hinkt uebrigens ein wenig, weil man sich in diesem Fall auf
ein "C" ganz ohne alles einigen konnte].

Ich will Ihnen auch nicht unterstellen, hier Transliterationen
zugunsten von Transkriptionen aufgeben zu wollen, sehe aber,
dass Sie dem Reiz der Transliteration, phonetisch "eingaengig"
zu sein, gefolgt sind.

In meinem Duden (alte Rechtschreibung ;-) finde ich auch
eine Transliterationstabelle fuer Arabische Namen, die einen Mix
aus (lateinischen) Buchstabenverdoppelungen und Diakritischen
Zeichen vorsieht. Neben vier reinen Symbolzeichen, die
nicht transkribiert werden gibt es ansonsten nur einen Gravis,
Makron, Makron untergesetzt, Punkt untergesetzt und Hacek
(vielleicht ist aber ein Brevis gemeint). Dh. mit vier(?)
Sonderzeichen plus fuenf Diakritika, die in Kombinationsmethode
eingesetzt werden koennen, waere man dabei (und die Diakritika
kann man auch noch fuer lateinische Buchstaben anderer
Sprachen benutzen).

Ihrem Einwand bezueglich Indexierung kann ich natuerlich nur
zustimmen, weil ich auch nicht glaube, dass normale Benutzer
ihre Suchbegriffe im Kopf transliterieren (koennen). Hier
boete es sich aber an, - zumindest bei allegro, zumindest
wenn nur eine Sprache transliteriert vorliegt - nur fuer
die Indexierung per Ersetzungsbefehlen die Transliteration
in eine (deutsche oder englische) Transkription umzuwandeln,
so dass "phonetisch" gesucht werden koennte. Feinheiten,
wie etwa, dass ein gewisses Zeichen als "dsch" transkribiert
wird, nur bei modernen Personennamen aus Aegypten und Sudan
als "g", sind natuerlich in der Transliteration bereits 
verloren gegangen.

Mein Standpunkt also: Die Erfindung eines neuen
Transliterationssystems halte ich fuer sehr problematisch.
Wenn es nur um Indexierungsprobleme geht, sollte sich auch
eine Loesung finden lassen. Den Mehraufwand fuer zusaetzliche
Zeichen halte ich auch fuer nicht tragisch. Einer 
Erfassung von Originalzeichen ist in heutigen Windows-Zeiten
sowieso der Vorzug zu geben, keine Ahnung, wie man dann
indexiert. Jedenfalls sollte es USMARC-Anwendungen geben,
die auch korrekt mit dem Wechsel der Schriftrichtung
umgehen koennen, allegro kann da nicht mithalten.

viele Gruesse
Thomas Berger





Mehr Informationen über die Mailingliste Allegro