Re: [Allegro] (ganz kleines) index-parameter-problem (ging früher)

B.Eversberg ev at biblio.tu-bs.de
Mi Apr 20 10:07:07 CEST 2005


Klaus Lehmann schrieb:
> 
> des rätsels lösung! (gerade erkannt!)
> 
> => engl. und dt. werden als stopwords betrachtet! 
>    s.a swl1.apt
> 
> 
> frage: wieso sind in der liste swl.apt eigentlich "dt" und "engl" enthalten? 
> bewusst? oder in meiner liste aus versehen? 
> meine datiert vom 10. febr. 2001..... plädiere für ein versehen....
> ich nehme sie zukünftig heraus. sehe keinen sinn darin...
> 
Wir nehmen es auch raus. Es ist wohl hineingeraten vor vielen Jahren, 
als man bemerkte, daß diese Abkürzungen oft in Einheitstiteln vorkommen, 
und man dachte, damit wolle sich wohl keiner seinen Index anreichern.
Die Philosophie hat sich in dieser Sache gewandelt, heute wird ja
meistens empfohlen, Stopwortlisten auf ganz wenige Wörter zu begrenzen, 
wenn überhaupt.
Wir sichten die Liste auf weitere verzichtbare Wörter.
Andererseits gab es mehrfach Anfragen, warum denn so viele sinnlose 
Wörter im Index stünden, und könne man das nicht unterbinden, so daß 
dort nur sinntragende, nichtirritierende Wörter erschienen.

MfG B.E.





Mehr Informationen über die Mailingliste Allegro