Vom Eise befreit
Thomas Berger
ThB.com at t-online.de
Di Apr 25 10:00:42 CEST 2000
Lieber Herr Eversberg,
liebe Liste,
> hier und da aktualisiert werden. Wichtiger Punkt: Bindestrich-Behandlung.
> Dieses letzte Wort wurde bislang so indexiert, wenn es in einem
> Titel vorkam:
> bindestrich-behandlung
> behandlung
> Jetzt wird das, uebereinstimmend mit den kommenden Empfehlungen der
> KfR fuer RAK, so gemacht:
> bindestrich
> bindestrichbehandlung
> behandlung
> Im Hinblick auf Find-Befehle ist das besser: mit "find tit bindestrich"
> wuerde man im ersten Fall den Titel nicht erwischen. Im Register sieht
> man's, und da ist die neue Regel eher irritierend, aber die Register
> finden manche ja ueberhaupt verwirrend und wollen sie am liebsten vor
> den Nutzern ganz verstecken. (Dass und warum das ein Irrweg waere, haben
> wir oft genug behandelt.)
Fuer eine Anwendung hatte ich so etwas letztes Jahr eingebaut
und musste es muehsam wieder herausbauen, obwohl bei einer
Maskensuche natuerlich bessere Findbarkeit herauskam.
Gruende waren:
* Bindestriche in Namen in Titeln:
"Felix Gonzalez-Torres" wird im Register u.a. zu
gonzaleztorres
"Ferrieres-en-Gatinais" wird zu
ferrieresengatinais
* Bindestriche in fremdsprachigen Titeln und Wendungen:
"peintre-graveur" wird im Register u.a. zu
peintregraveur
"fifteenth-century" wird zu
fifteenthcentury
"fin-de-siecle" wird zu
findesiecle
"storico-politico-numismatica" wird zu
storicopoliticonumismatica
"Musashino-Bijutsu-Daigaku-kenkyu-kiyo" wird zu
musashinobijutsudaigakukenkyukiyo
( = Bulletin of the Musashino Art University,
in der indexierten Form vermutlich auch fuer
Japaner nicht mehr verstaendlich)
* Mehrfachbindestriche im Deutschen:
"Felix-Nussbaum-Haus" wird im Register u.a. zu
felixnussbaumhaus
"Flavius-Josephus-Handschriften" wird zu
flaviusjosephushandschriften
"Ernst-von-Siemens-Stiftung" wird zu
ernstvonsiemensstiftung
"Karl-Schmidt-Rottluff-Stipendium" wird zu
karlschmidtrottlufstipendium
"Anna-Selbdritt-Triptychon" wird zu
annaselbdritttriptychon
(immerhin muss hier nicht aufgrund alter
Ortographie noch ein "t" eliminiert werden...:-)
"Mutter-Kind-Amme-Darstellungen" wird zu
mutterkindammedarstellungen
* gewisse Reihungen im Deutschen
"musikalisch-rhythmische" wird zu
musikalischrhytmische
Der unbestrittene(?) Nutzen bei gewissen Einbindestrich-
Kombinationen im Deutschen ("Fluid-System", "Focke-Museum",
"Gegen-Strategien", "Keller-Zeichnungen", "Frauen-Portraets")
trat in einer Datenbank mit ca. 100.000 Titeln sehr stark
zurueck (nicht nur subjektiv, sondern auch zahlenmaessig),
wenn man die obigen Verheerungen betrachtet.
Besonders problematisch war die Aktion, weil es sich
um ein kombiniertes Stichwort- und Titelanfangsregister
handelte, in dem auch Verweise von Titelschlagworten
auf Personen (deren Bindestriche ja normalerweise
nicht getoetet werden) in anderen Registern enthielten.
Fazit:
Diese Form der Indexierung macht Stichwortregister
fuer die Registersuche durch Menschen ziemlich unangenehm
und sollte vermutlich nur fuer ein gedoppeltes, internes
"Maskensuchregister" eingesetzt werden.
Vermutlich ist diese Form der Indexierung sowieso
der falsche Weg: Ein OPAC muss auch hier noch
einigen Aufwand treiben, um bei Eingaben mit
Bindestrich auch die gaenzlich ohne Bindestrich
erfassten Titel zu finden, d.h. er wird nach
moeglichkeit (auch) nach Einzelbestandteilen suchen.
Zur ueberwiegenden Anzahl von Bindestrichkombinationen
(behaupte ich) entspricht sowieso keine sinnvolle
Zusammenschreibung, es bleibt ein Rest von
Worten ("Muellermuseum"), die in der Vorlage
zusammengeschrieben sind aber getrennt (u.u.
ganz ohne Bindestrich "Muller museum") gesucht
werden. Hier hilft letztendlich aber auch eine
staerkere *Zerlegung* mit Hilfe linguistischer
Algorithmen mehr, als das Zusammenziehen zu
Ungetuemen.
viele Gruesse
Thomas Berger
Mehr Informationen über die Mailingliste Allegro