a99: Groesse der Ergebnismenge

Hilger Weisweiler hilger.weisweiler at ub.uni-tuebingen.de
Mi Mai 12 07:28:17 CEST 2004


Lieber Herr Eversberg, liebe Liste,

den erfreulichen Umstand, dass a99/alcarta jetzt Ergebnismengen von 
einem Umfang bis zu 256.000 Treffern bilden kann, haben wir dazu 
genutzt, in unserer Datenbank eine registerbasierte Sprachencodierung 
einzufuehren. Jede Dokumentbeschreibung erhaelt einen zweitstelligen 
Zahlencode, z.B. "01" fuer "Deutsch". Im Index (bei uns Register 7) 
wird dieser in die klarsprachliche Bezeichnung umgesetzt, und zwar 
auf Deutsch und auf Englisch, und erhaelt das Praefix "lan:". Die 
Indexeintragungen lauten also:

nnnnn lan:deutsch

bzw.

nnnnn lan:german

Fuer die Indexierung lautet das Indexpraefix "|7lan:", die 
symbolische Registerbezeichnung heisst "lan ", so dass mit der 
Sprachbezeichnung im Feindmenue und per Kommandozeile direkt 
gesucht werden kann. 

Fuer Index 7 im allgemeinen haben wir eine symbolische 
Registerbezeichnung "div " (fuer "Diverses"; wir haben naemlich 
weitere Passagen mit anderen Praefixen der beschriebenen Art). Bisher 
konnten wir mit dem Kommando "div lan:?" in der Suchbefehlszeile 
zuverlaessig ermitteln, wie viele Saetze wir bereits mit einer 
Sprachcodierung versehen haben. Seit deren Zahl auf ueber 134.000 
angewachsen ist, geht das nicht mehr. Die Trefferzahl bei dieser 
Anfrage ist derzeit um mehr als 10.000 geringer als die tatsaechliche 
Zahl der Datensaetze. Trunkiert man die Indexeintragungen bei der 
dritten oder vierten Position, kommt die Meldung: "Sorry, set is too 
large", obwohl keineswegs mehr als 256.000 Datensaetze mit 
Sprachcodierung versehen sind. Wohl jedoch gibt es (wegen der 
Doppeleintragungen auf Deutsch und Englisch) eine Zahl von 
Indexeintraegen, die groesser ist als die genannte Zahl.

Was jedoch weiterhin zuverlaessig funktioniert: 
Im Index mit "Erg." eine Indexzeile zusammenfassen und dann die 
weiteren Zeilen mit "or" aufsummieren.

Frage: Laesst sich das beschriebene Phaenomen ausmerzen? Falls nein: 
Kann es dazu fuehren, dass irgendwann einmal auch die kombinatorische 
Recherche mit einem andern Suchaspekt und der Sprachbezeichnung nicht 
mehr klappt?

Beste Gruesse, Dank fuer Hinweise,
H. Weisweiler
---------------------------------------------------
Dr. Hilger Weisweiler
Leiter der Theologischen Abteilung
Universitaetsbibliothek Tuebingen
Tel. +49 (0)7071/297 2835





Mehr Informationen über die Mailingliste Allegro