Sonder-Vb.2: STAR links ueberholt

Bernhard Eversberg EV at buch.biblio.etc.tu-bs.de
Mo Mär 26 10:15:54 CEST 2001


Lackhoff und Berger plaedieren:

> Wahrscheinlich sind all diese "unansehnlichen" Techniken mit dem 
> Index nur einem breiten Publikum zu verkaufen, wenn das, was im 
> Index _gefunden_ wird von dem entkoppelt wird, was im Index _zu 
> sehen_ ist. Ob so etwas realisierbar ist koennen natuerlich nur die 
> Entwickler sagen.
Der Preis waere das Erfordernis eines zusaetzlichen, internen
String-Arrays fuer die tatsaechlichen Indexeintraege, denn beim
Blaettern muss immer auf diese zurueckgegriffen werden. Das
kostet Platz (wohl nicht viel) und Verwaltungsarbeit, also Zeit.
Muss naeher geprueft werden.
Gravierender aber: Die Indexdatei wird spuerbar groesser! Denn
das Anhaengsel, das dann den sichtbaren String darstellen soll,
faellt nicht in die Komprimierungstechnik. Die erfasst nur die
jeweils identischen Anfangsteile von aufeinanderfolgenden Strings.
Alle solche Zusaetze kaemen also mit voller Zeichenzahl in die Datei.
Wer also hinterher meint, na prima! jetzt machen wir das bei allen
Registern und haben dann z.B. die natuerliche Schreibung mit Umlauten
und allem auch im Index, der wuerde sein blaues Wunder erleben. Z.B.
wuerden dann auch gross und klein geschriebene Eintraege auf einmal
getrennt erscheinen...
 
Fuer's Parametrieren ist es eine neue Herausforderung (gibt's immer 
noch nicht genug?), denn es wird auch wieder Potential fuer neue 
Verwirrungen geben, wenn man sowas macht.
Ich kann nur appellieren: steckt Gehirnschmalz in die Indextechnik
so wie sie ist. Alles andere wird teurer. 

> Und noch ein Problem sehe ich, wenn man eine dieser Techniken 
> einsetzen will: Die Zahl der Indexe ist zu klein, es sei denn man 
> will normale Eintraege mit diesen besonderen Eintraegen mischen. 
> Eigentlich muesste es zu jedem "normalen" Index (mindestens) 
> einen parallelen geben, in dem nur dann gesucht wird, wenn man 
> Linkstrunkierung bzw. "Suche nach Gehoer" haben moechte. Ohne 
> die Trennung steigen die Treffermengen wohl zu steil an.
> 
Soll denn nicht nur das Wortregister, sondern auch andere fuer
eine Volltextsuche aufbereitet werden? Ich vermute, das geht dann
doch zu weit.
Um es aber klar zu sagen: Keinesfalls werden wir die Zahl der Register 
ueber 11 hinaus erhoehen.


Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329, 
D-38023 Braunschweig, Germany
Tel.  +49 531 391-5026 , -5011 , FAX  -5836
e-mail  B.Eversberg at tu-bs.de  




Mehr Informationen über die Mailingliste Allegro