[Allegro] a35 - Indexeintrag mit Bindestrich

Thomas Berger ThB at Gymel.com
Fr Mär 21 18:05:45 CET 2014


Lieber Klaus, liebe Liste,

>> getrennt waere dann "einzeln". "Getrennt" im Sinne von Teilphrase ist auch
>> eine Option, vor allem aber gab es da mal die Zusammenschreibung, wie etwa
>> bei "Retrievalsystem"
> 
> richtig, nicht zu vergessen: ohne Bindestrich ist in vielen Fällen korrekte Rechtschreibung. Warum also nicht Indexierung von:
> 
> retrieval-system
> retrieval
> system
> retrievalsystem

Ich denke auch, dass so eine Dreifachbehandlung von Bindestrichwoertern
Standard sein sollte. Also einmal so wie erfasst, zweitens mit eliminierten
Bindestrichen (Albertschweitzergesamtschule) und drittens mit allen Strichen
als Spatien interpretiert. Was "Browsing" angeht, ist so ein Index
dann schon recht grenzwertig...

Strenggenommen sollte das fuer alle Binnen-Interpunktion passieren, also
auch fuer "." und "/": In den Vorlageformen der Verfasserangabe aber auch
in den "normalen" Titeln und Zusaetzen wird ja - ohne dass sich der Text
der RAK da nennenswert geaendert hat - inzwischen der Vorlagentreue ein
viel hoeherer Stellenwert eingeraeumt als der Normierung und das bedeutet,
dass wir in den Daten inzwischen auf die volle Bandbreite aller Schreibweisen
treffen, so wie auch in den Benutzereingaben. Nur dass wir natuerlich
dennoch nicht davon ausgehen duerfen, dass der Benutzer nun ausgerechnet
die Vorlageform korrekt erraet, wo er traditionell schon an der normierten
Form gescheitert ist (ausserdem ist es nicht seine Aufgabe, auf Basis
seiner Information das Endergebnis bibliothekarischen Handelns zu erraten)

Ausserdem wandeln sich ja die Vorlagen, eigentlich muessten wir nun auch
stets Binnenmajuskeln ("RetrievalSystem") erkennen oder - immer weniger wird
ja per Tastatur in die Datensaetze oder Suchformulare gebracht - auch nicht
eingebbare Zeichen wie Soft Hyphens ("­" habe ich gerade heute
nachmittag in irgendwelchen Retrokon-Daten gezeigt bekommen - vermutlich
war irgendwo in der Kette ein Textverarbeitungsprogramm mit Autokorrektur
beteiligt...).

Gar nicht ueber (Wort-)indizes zu gehen sondern Methoden einzusetzen,
die naeher an Volltextsuchmaschinen orientiert sind (n-Gramme, Ranking,
woerterbuchunterstuetzte Methoden, ...) halte ich aber ebenso fuer
legitim, auch wenn "Browsing" dann auch technisch nicht moeglich ist.

Fuer mich bedeutet das aber vor allem, dass "Aufbereitung" als Aufgabe
der Retrievalsysteme ernst zu nehmen ist /und/ bestaendiger Anpassung
unterworfen sein muss, auch wiederum mit Blick auf die jeweiligen
Benutzergruppen und Materialien (Ein "Musik"-Katalog muss z.B. kraeftig
daran arbeiten, dass "Op. 27,2" sowohl in Fussnoten/Regesten/Freitextfeldern
als auch in Suchanfragen eben nicht voellig atomisiert wird, sondern
moeglichst ueberall als Phrase wirkt, selbst wenn eigentlich nach "Stichwort"
gesucht wird). Und es bedeutet auch fuer mich, dass "die Regelwerke"
von solchen Details die Finger lassen sollten, dafuer sind sie einfach zu
sehr auf Universalismus bedacht und zudem viel zu unflexibel und zu
langsam in der Reaktion auf Trends: Gute Eigenschaften, wenn es um "die
Daten" geht, aber schlecht wenn es darum geht was man /jetzt/ damit
macht.

(Soviel als Wort zum Sonntag)
viele Gruesse
Thomas Berger






Mehr Informationen über die Mailingliste Allegro