[Allegro] Stoppwortliste und Artikelliste
Heinrich Allers
allers at t-online.de
Di Mai 8 00:48:49 CEST 2012
Hallo allerseits!
obwohl es in der in der Braunschweiger Allegro-Auslieferung enthaltenen Konfigurationsdatei
drinsteht:
> Artikelliste (war bis Version 12.1 automatisch drin)
> (nicht verwechseln mit der Stopwortliste in der .API)
bin ich mir nicht so sicher, ob allen der Unterschied zwischen der in der Konfigurationsdatei enthaltenen
ARTIKELLISTE und der in der Datei swl1.apt enthaltenen STOPPWORTLISTE (ja, 'Stopp' mit 2 p, auch
nach der Rechtschreibreform!) klar ist.
Die Artikelliste bewirkt bei der Eingabe von Titeln, die mit in ihr enthaltenen Artikeln anfangen, die
Nachfrage, ob wirklich dann auch später, bei sortierten Ausgaben, unter diesem Artikel sortiert werden
soll.
Die Stoppwortliste enthält die Wörter bzw. Zeichen oder Zeichenfolgen, deren Indexierung bei Allegros
Registeraufbau unterbleiben soll. (Wer sucht schon in einem der Register nach dem sinnträchtigen
Eintrag '3' oder 'f'; na ja, zugegebenermaßen enthält die Standard-Stoppwortliste auch solch leicht
sinnträchtigeren Zeichenfolgen wie z.B. 'how', 'ihre' und 'ist').
Mich an dieser Stelle dem "mainstream" fügend, würde ich heute auch dazu neigen, die Stoppwortliste
über Bord zu werfen; daß die Datei cat.aex dabei gerade mal um ca. 17 % größer wird, das bildet keinen
Grund dagegen.
Bei der Frage der Artikelliste und ihrer Einwirkung auf die Erfassungspraxis bleibe ich noch hart.
Nicht-sinntragende Wörter am Anfang des Titels sollen weiter als solche gekennzeichnet werden. Bei der
Indexierung hingegen bin ich leidenschaftslos: sollen sie doch doppelt indexiert werden, einmal mit und
einmal ohne führendem Artikel! Vergrößert die Indexdatei cat.adx auch gerade mal nur um ca. 13 %.
###
Nun warte ich auf die Frage, wie nach Titel geordnete Listen sortiert werden sollen, denn um die geht es
ja letztlich, wie das Wort "Nichtsortierzeichen" andeutet, für das Zeichen benutzt, das bei der Sortierung
nicht zu berücksichtigenden Wörtern vorangeht oder sie einschließt. :-))
Mit freundlichen Grüßen von
Heinrich Allers
allers at t-online.de * http://www.h-allers.de
Netztagebuch: http://heinrich-erlo-ger.blogspot.com/
Bitácora: http://heinrich-erlo-spa.blogspot.com/
Mehr Informationen über die Mailingliste Allegro