Vom Eise befreit

Thomas Berger ThB.com at t-online.de
Di Apr 25 10:00:42 CEST 2000


Lieber Herr Eversberg,
liebe Liste,

>    hier und da aktualisiert werden. Wichtiger Punkt: Bindestrich-Behandlung.
>    Dieses letzte Wort wurde bislang so indexiert, wenn es in einem
>    Titel vorkam:
>      bindestrich-behandlung
>      behandlung
>    Jetzt wird das, uebereinstimmend mit den kommenden Empfehlungen der
>    KfR fuer RAK, so gemacht:
>      bindestrich
>      bindestrichbehandlung
>      behandlung
>    Im Hinblick auf Find-Befehle ist das besser: mit "find tit bindestrich"
>    wuerde man im ersten Fall den Titel nicht erwischen. Im Register sieht
>    man's, und da ist die neue Regel eher irritierend, aber die Register
>    finden manche ja ueberhaupt verwirrend und wollen sie am liebsten vor
>    den Nutzern ganz verstecken. (Dass und warum das ein Irrweg waere, haben
>    wir oft genug behandelt.)

Fuer eine Anwendung hatte ich so etwas letztes Jahr eingebaut
und musste es muehsam wieder herausbauen, obwohl bei einer
Maskensuche natuerlich bessere Findbarkeit herauskam.

Gruende waren:

* Bindestriche in Namen in Titeln:
  "Felix Gonzalez-Torres" wird im Register u.a. zu
  gonzaleztorres
  "Ferrieres-en-Gatinais" wird zu
  ferrieresengatinais

* Bindestriche in fremdsprachigen Titeln und Wendungen:
  "peintre-graveur" wird im Register u.a. zu
  peintregraveur
  "fifteenth-century" wird zu
  fifteenthcentury
  "fin-de-siecle" wird zu
  findesiecle
  "storico-politico-numismatica" wird zu
  storicopoliticonumismatica
  "Musashino-Bijutsu-Daigaku-kenkyu-kiyo" wird zu
  musashinobijutsudaigakukenkyukiyo
  ( = Bulletin of the Musashino Art University,
  in der indexierten Form vermutlich auch fuer
  Japaner nicht mehr verstaendlich)

* Mehrfachbindestriche im Deutschen:
  "Felix-Nussbaum-Haus" wird im Register u.a. zu
  felixnussbaumhaus
  "Flavius-Josephus-Handschriften" wird zu
  flaviusjosephushandschriften
  "Ernst-von-Siemens-Stiftung" wird zu
  ernstvonsiemensstiftung
  "Karl-Schmidt-Rottluff-Stipendium" wird zu
  karlschmidtrottlufstipendium
  "Anna-Selbdritt-Triptychon" wird zu
  annaselbdritttriptychon
  (immerhin muss hier nicht aufgrund alter
   Ortographie noch ein "t" eliminiert werden...:-)
  "Mutter-Kind-Amme-Darstellungen" wird zu
  mutterkindammedarstellungen

* gewisse Reihungen im Deutschen
  "musikalisch-rhythmische" wird zu 
  musikalischrhytmische


Der unbestrittene(?) Nutzen bei gewissen Einbindestrich-
Kombinationen im Deutschen ("Fluid-System", "Focke-Museum",
"Gegen-Strategien", "Keller-Zeichnungen", "Frauen-Portraets") 
trat in einer Datenbank mit ca. 100.000 Titeln sehr stark 
zurueck (nicht nur subjektiv, sondern auch zahlenmaessig),
wenn man die obigen Verheerungen betrachtet.

Besonders problematisch war die Aktion, weil es sich
um ein kombiniertes Stichwort- und Titelanfangsregister
handelte, in dem auch Verweise von Titelschlagworten
auf Personen (deren Bindestriche ja normalerweise
nicht getoetet werden) in anderen Registern enthielten.

Fazit: 
Diese Form der Indexierung macht Stichwortregister
fuer die Registersuche durch Menschen ziemlich unangenehm
und sollte vermutlich nur fuer ein gedoppeltes, internes
"Maskensuchregister" eingesetzt werden.

Vermutlich ist diese Form der Indexierung sowieso
der falsche Weg: Ein OPAC muss auch hier noch
einigen Aufwand treiben, um bei Eingaben mit
Bindestrich auch die gaenzlich ohne Bindestrich
erfassten Titel zu finden, d.h. er wird nach
moeglichkeit (auch) nach Einzelbestandteilen suchen.
Zur ueberwiegenden Anzahl von Bindestrichkombinationen
(behaupte ich) entspricht sowieso keine sinnvolle
Zusammenschreibung, es bleibt ein Rest von 
Worten ("Muellermuseum"), die in der Vorlage
zusammengeschrieben sind aber getrennt (u.u.
ganz ohne Bindestrich "Muller museum") gesucht 
werden. Hier hilft letztendlich aber auch eine
staerkere *Zerlegung* mit Hilfe linguistischer
Algorithmen mehr, als das Zusammenziehen zu
Ungetuemen.

viele Gruesse
Thomas Berger





Mehr Informationen über die Mailingliste Allegro