a99: Groesse der Ergebnismenge
Hilger Weisweiler
hilger.weisweiler at ub.uni-tuebingen.de
Mi Mai 12 07:28:17 CEST 2004
Lieber Herr Eversberg, liebe Liste,
den erfreulichen Umstand, dass a99/alcarta jetzt Ergebnismengen von
einem Umfang bis zu 256.000 Treffern bilden kann, haben wir dazu
genutzt, in unserer Datenbank eine registerbasierte Sprachencodierung
einzufuehren. Jede Dokumentbeschreibung erhaelt einen zweitstelligen
Zahlencode, z.B. "01" fuer "Deutsch". Im Index (bei uns Register 7)
wird dieser in die klarsprachliche Bezeichnung umgesetzt, und zwar
auf Deutsch und auf Englisch, und erhaelt das Praefix "lan:". Die
Indexeintragungen lauten also:
nnnnn lan:deutsch
bzw.
nnnnn lan:german
Fuer die Indexierung lautet das Indexpraefix "|7lan:", die
symbolische Registerbezeichnung heisst "lan ", so dass mit der
Sprachbezeichnung im Feindmenue und per Kommandozeile direkt
gesucht werden kann.
Fuer Index 7 im allgemeinen haben wir eine symbolische
Registerbezeichnung "div " (fuer "Diverses"; wir haben naemlich
weitere Passagen mit anderen Praefixen der beschriebenen Art). Bisher
konnten wir mit dem Kommando "div lan:?" in der Suchbefehlszeile
zuverlaessig ermitteln, wie viele Saetze wir bereits mit einer
Sprachcodierung versehen haben. Seit deren Zahl auf ueber 134.000
angewachsen ist, geht das nicht mehr. Die Trefferzahl bei dieser
Anfrage ist derzeit um mehr als 10.000 geringer als die tatsaechliche
Zahl der Datensaetze. Trunkiert man die Indexeintragungen bei der
dritten oder vierten Position, kommt die Meldung: "Sorry, set is too
large", obwohl keineswegs mehr als 256.000 Datensaetze mit
Sprachcodierung versehen sind. Wohl jedoch gibt es (wegen der
Doppeleintragungen auf Deutsch und Englisch) eine Zahl von
Indexeintraegen, die groesser ist als die genannte Zahl.
Was jedoch weiterhin zuverlaessig funktioniert:
Im Index mit "Erg." eine Indexzeile zusammenfassen und dann die
weiteren Zeilen mit "or" aufsummieren.
Frage: Laesst sich das beschriebene Phaenomen ausmerzen? Falls nein:
Kann es dazu fuehren, dass irgendwann einmal auch die kombinatorische
Recherche mit einem andern Suchaspekt und der Sprachbezeichnung nicht
mehr klappt?
Beste Gruesse, Dank fuer Hinweise,
H. Weisweiler
---------------------------------------------------
Dr. Hilger Weisweiler
Leiter der Theologischen Abteilung
Universitaetsbibliothek Tuebingen
Tel. +49 (0)7071/297 2835
Mehr Informationen über die Mailingliste Allegro