[Allegro] a35 - Indexeintrag mit Bindestrich

Bernhard Eversberg ev at biblio.tu-bs.de
Mo Mär 24 13:09:13 CET 2014


Am 24.03.2014 11:42, schrieb Fischer, Thomas:
> ...
>> Das "allegro"-System hat nun aber im Kern die
>> Technik der sortierten Register als zentrales Wirkprinzip und nur
>> als Hilfe für gewisse Fälle, nicht für den OPAC, die Volltextsuche.
>
> meine Vorstellung ist eher die, zu versuchen, das Beste aus den verschiedenen Welten zu erreichen.
> Der billige Speicherplatz erlaubt ja heutzutage, mehr und größere Indexe zu erzeugen, die dann auch verschiedene Funktionen haben können.

Außerdem hatten wir irgendwann die 2GB-Grenze längst überwunden, indem
man mehrere zusätzliche Indexdateien machen kann.
>

> Zunächst würde ich den Such- und den Browse-Index nicht unbedingt in eins setzen, ich unternehme da ein paar Klimmzüge, um unseren NutzerInnen beim Blättern nicht die übersetzten, sondern die Originaleinträge zu präsentieren (natürlich nur im Browser, solange A99 mit UTF-8 in Registern nichts anfangen kann).
> Und für die Recherche wünsche ich mir, dass die Einträge der Suchenden möglichst effektiv zu Ergebnissen führen. Wenn ich meine Göttingen Adresse nehme, möchte ich z.B. dass die Obere Maschstr. auch als Obere-Masch-Str. gefunden wird (was wohl falsch, aber weit verbreitet ist), (und auch als Obere Maschstraße, aber das ist ein anderes Feld). Google kriegt das übrigens nicht zusammen, was genau passiert ist mir unklar.
> Bei Bindestrichen sehe ich das so, dass
> - zusammengesetzt Worte technisch nicht mehr separiert werden können: Oberemaschstr. also im Index auffindbar sein müsste,
> - in einem Browsingregister möglichst die korrekte Schreibweise und eventuell noch abweichende Versionen zu finden sein sollten,
> - das System dafür sorgen sollte, dass mit Bindestrichen eingegebene Suchen auch die getrennte Schreibweise finden sollten und umgekehrt.
> Dem entspricht die von Herrn Berger erwähnte Dreifachindexierung: zusammen, mit Bindestrich und getrennt als verschiedene Einträge.
Wir richten das für die Standardparameter cat.api auch noch so um, das
ist keine große Sache.

> Die Suche setzt dann getrennte oder mit Bindestrich verbundene Ausdrücke in eine entsprechende UND-Anfrage um. Im Browser ist das relativ einfach, bei A99 könnte das auch ein Flex erreichen.
>
Richtig, auch in a35 wird das so gemacht (a35erg.job), außerdem
stellen wir anheim, sich einen Solr-Index zu leisten, der allerhand
weitere Möglichkeiten bietet.

B.E.




Mehr Informationen über die Mailingliste Allegro