Indexierung von Bindestrich-Woertern

Annemarie Tews tews at ub.uni-leipzig.de
Mi Mär 7 10:26:02 CET 2001


-------------- nächster Teil --------------
Ein Vorschlag zur Bindestrich-Problematik

Bezug: Eversberg/Berger in der Liste im April 2000

In der Demo-Datenbank werden obige Bindestrichwörter gegenwärtig so indiziert:
berater             anna
betriebs            selbdritt
                    tryptichon
betriebs-berater    anna-selbdritt-triptychon
Aufgrund des Einwandes von Berger  fehlt:
betriebsberater	    annaselbdritttriptychon 

Um den „betriebsberater" ohne „annaselbdritttriptychon„ zu gewinnen, stelle ich zur Diskussion 
eine Indexierung ohne Bindestrich hinzuzufügen, dabei aber  Ausnahmen A1 – A3 zu 
machen. 
Eine zweite Variante wäre, nur die Ausnahme A2 zu berücksichtigen. Man findet dann alle 
Bindestrichworte mit einem Bindestrich zusätzlich als Gesamtwort und muß dann aber über 
Konstruktionen wie „didaktischmethodisch" hinwegsehen. 
Über eine Ausnahme A4 braucht man nur nachzudenken, wenn man sich für A1 –A3 
entscheidet.

Definition:
Im folgenden wird unter „Bindestrichwort" ein Wort mit mindestens einem Bindestrich 
verstanden. Wortbestandteile sind die Zeichen vor, nach bzw. zwischen Bindestrichen.
Wörter, in denen Bindestriche für ein Ergänzung stehen, zählen nicht dazu (Kinder- und 
hausmärchen, Warenein- und -ausgang).

Es wird das Bindestrichwort ohne Bindestrich indiziert mit folgenden Ausnahmen:
A1.	Bindestrich an 2. oder 3. Wortstelle
	Beispiele: a-dur, h-moll, k-theorie, n-mobile, o-beine, t-shirt, x-ray, z-transformation
	bi-lexikon, it-sicherheit, ms-dos, ns-regime, pc-gestützt
Verworfen wird die Ausnahme mit dem Bindestrich an der 4. Wortstelle wegen alt-,  aus-, bau-,  
bio-, dom-, ehe-, erb-,  erz-, gas-, hof-, lob-,  neo-, neu-, ost-, pro-, see-, tax-, weg-. 
A2.	wenn mehr als ein Bindestrich vorkommt
Beispiele:a-b-c-buch, adam-ries-drucke, albert-ludwigs-universität, bach-werke-
verzeichnis, berlin-leipzig-würzburg-stuttgart-zürich, client-server-system, fin-de-siecle
A3.	wenn ein Wortbestandteil die folgende Zeichen enthält:
	ico-         
	isch-         
	ismus-
	lich-          
	mecko
Der Bindestrich muß mit hinein, damit nicht –lexicon, -bischof und –licht drunter fallen.
	Beispiele: afro-amerikanisch, aller-christlichste, alt-persisch, anatomico-
	chirurgicae, braunschweig-lueneburgisch, historico-moralisch, medico-
	statistica,  nemecko-cesky, öffentlich-rechtlich, physico-chemico, römisch-
	katholisch, schleswig-holsteinisch, thüringisch-sächsisch , west-östlich, 
	wissenschaftlich-technisch
Leider fallen ein paar Zusammensetzungen unter diese Regel, die ich gern ohne 
Bindestrich hätte: catechismus-übung, chur-bayrisch,  fleisch-beschau, gross-
brittanisch, hoch-ansehnlich, mittel-asiatisch, ober-rheinisch, ost-indisch, tich-
gesellschaft. Schade.

Eine solche Minimalvariante ist in der Indexparameterdatei leicht zu realisieren.

Die Ausnahmen A1 – A3 zeigen in untersuchten  OPAC's Leipzig folgenden Effekt:
UB Leipzig
Anzahl von Bindestrichworten:   46 250
nach A1 – A3 verbleiben:        33 400
es fallen unter Regel A1: 1 850     A2:  3600  A3: 8 000 Bindestrichworte

Bucharchiv München
Anzahl von Bindestrichworten:    5 500
nach A1 – A3 verbleiben:         4 500

Lehrerseminar Leipzig
Anzahl von Bindestrichworten:    1 000
nach A1 – A3 verbleiben:           610


Es bleiben eine Reihe „unschöner" Zusammensetzungen mit Silben wie
afro-,  anglo-, anti-, audio-,  edv- , english-,  etats-, francais-, fuzzy-,  gallo-, german-, 
high-, indo-,  pan-,  sachsen-, saint-, unix-  (Auswahl). Die englischen Zahlwörter sowie 
Zusammensetzungen  ( eighteenth-century, eighty-four) sind auch unschön, fallen jedoch auf 
jeweils eine Zeile im Register.  Entgegen Herrn Bergers Meinung finde ich, dem stehen aber 
Tausende von vernünftigen Zusammenziehungen gegenüber.
Hier könnte folgende Ausnahme greifen:
A4.	wenn ein Wortbestandteil in einer „Trennliste" steht.
Die Trennliste müsste von allegro in ähnlicher Weisebehandelt werden, wie es jetzt 
mit der Stopwortliste geschieht.

Mit „Exoten", die einen Punkt vor dem Bindestrich haben  wie ev.-luth., st.-peterburg, königl.-
saechsisch , u.s.-amerikanisch, Ausst.-Kat.  kann man kaum etwas machen.

Erfahrungen und Meinungen wrden mich interessieren,

Annemarie Tews



Mehr Informationen über die Mailingliste Allegro