[Allegro] a35 - Indexeintrag mit Bindestrich

Bernhard Eversberg ev at biblio.tu-bs.de
Fr Mär 21 10:09:30 CET 2014


Am 21.03.2014 09:44, schrieb Klaus Lepsky:
>
> a35 hat ein Problem mit dem Anzeigen der Kurztrefferliste, wenn
> Indexeinträge einen Bindestrich haben. Aufgefallen ist es zunächst bei
> einer eigenen Datenbank:
>
> http://ixtrieve.fh-koeln.de/a35/litie/
>
> Dort führt z.B. die Suche nach "online" im Index "Alle Wörter" zu
> einer Liste der mit "online" beginnenden Indexeinträge mit
> Bindestrich. Bei nur einem Treffer wird dieser angezeigt, bei mehreren
> nichts.
>

Gefunden werden kann nur, was im Index steht, das ist klar, und nur
so, *wie* es im Index steht. Gesucht wird zudem im Fall der
Schnellsuche im ALL-Register nicht exakt das, was eingetippt wurde,
in genau der Form, *wie* es eingetippt wurde, sondern es findet
normalerweise (ohne _ vor dem Eingabetext) eine Vorbearbeitung
statt: Bei den Normalregistern anhand der Zeilen -i (i=1...9,:,;)
in den Indexparametern, bei der sog. "Schnellsuche", intern über
das ALL-Register werden die eingegebenen Wörter noch dazu mit UND
verknüpft und, wenn im ersten Anhieb nichts rauskommt, werden die
Wörter trunkiert; kommt auch dabei nichts, werden von den Wörtern
noch versuchsweise hinten die Buchstaben  s n e r  abgeschnitten und
? angefügt - in vielen Faellen werden dadurch Plural- und
Genitivendungen beseitigt, das kann recht oft was bringen.
(Das wird ausgeführt in  onfnda99.flx  bei a99 bzw. analog in a35erg.job
bei a35)

Alles dies muß man sich im Prinzip vor Augen halten, wenn man kein
Ergebnis bekommt. (Das kann der Endnutzer natürlich nicht! Von den
Suchmaschinen her ist er aber gewöhnt, daß nicht immer was Plausibles
oder Nachvollziehbares rauskommt. Das ist hier aber nicht das Thema.)

Im Fall des Bindestrichs ergeben sich damit zwei Fragen, die aber
eng zusammenhängen:

1. Wie werden Bindestrichwörter indexiert?
    Im Standardmodell werden sie zerlegt in zwei Wörter, sowohl
    für das Titelwort- wie für das ALL-Register. Das kombinierte
    wort (mit oder ohne -) ist somit nicht im Register.

2. Wie wird eine Nutzereingabe mit - behandelt? Zerlegt, oder
    der - rausgenommen, oder gesucht wie eingegeben?

Es mag in beiden Fällen Nachbesserungsbedarf geben. Wir können sicher
für V34.1 noch schnell was machen. Konkrete Vorschläge?

B.Eversberg





Mehr Informationen über die Mailingliste Allegro