[Allegro] Indexparameter cat.api modernisieren?

Bernhard Eversberg ev at biblio.tu-bs.de
Do Jul 22 16:21:44 CEST 2010


Thomas Berger schrieb:
> 
> Was ist "alles Wortgut"? Alle Felder, alle "bibliographischen" Felder, alle
> Felder mit Transkriptionen aus der Vorlage? Sie hatten neulich ja erst
> die Lucene-Indexierung vorgestellt, die ja die Trunkierungsmodi und
> Distanzkennungen beherrscht, die man benoetigt, um solch eine Salat-Suche
> noch beherrschbar zu machen. Der Weg geht m.W. aber ueber n-Gramm-Indizes
> zur effizienten Vorauswahl nebst ausgefeilterer Volltextsuche in den gefundenen
> Saetzen.
> 
Erst mal nur schnell noch hierzu:
Die Solr-Technik wollte ich hier nicht einbeziehen, denn wir können die
nicht derartig integrieren, daß sie automatisch zum Standard gehört und,
dem Nutzer unbewußt, mit installiert wird, so schön das auch wäre. Dazu
sind nutzerseitig schon ein paar Hantierungen nötig, die wir zwar
beschrieben haben, die aber gleichwohl nicht jedermanns Sache sind.
Vor allem muß ein Server da sein, der eine IP-Nummer hat und auf
dem Jetty läuft. Das geht wohl nicht in jeder Umgebung, in der mit
allegro gearbeitet wird. Wer irgend kann, sollte sich aber damit
befassen, besonders wenn man richtig große Datenmengen hat.

Anscheinend sollten wir doch, Ihre anderen Aussagen bedenkend,
an eine separate Indexdatei denken. Die hätte den Vorzug, daß der
Anwender dazu selber nichts Neues tun und wissen muß.

B.E.





Mehr Informationen über die Mailingliste Allegro