Re: zu: index-problem bei großen datenbanken (über 4 mill datensätze)
Bernhard Eversberg
ev at buch.biblio.etc.tu-bs.de
Do Sep 9 12:04:21 CEST 2004
Bitte keine Attachments an die Liste!
On 9 Sep 04, at 10:43, Klaus Lehmann wrote:
>
> bitte schauen sie doch mal:
> qrix scheint als letzten datensatz etwas angefasst gehabt zu haben, was mit
> "krakau" zu tun hat.
>
> aber in der datei ald_173, die ich hier in eine vorhandene große dbc-datenbank
> reinindexiere, in dieser datei 173 kommt dieser ausdrucke NICHT vor. er kommt,
> wenn ich ihn als string in den bereits verarbeiteten ald's bis 172 (incl) suche,
> öfters vor. also, ist das ein alter fehler, der früher sauber durchging, jetzt
> aber gefunden wird? beim einarbeiten von 173 in die komplette datenbank? kann das
> sein?
>
> in der fehler.txt sind ca 5 registereinträge, die nicht koscher sind, zu
> entdecken. sie scheinen nicht aus 173_ald zu entstammen.
>
Es muss da Unsauberkeiten in den Daten geben, die von den Indexparametern nicht
abgefangen werden. Welche das sein könnten, ist natürlich schwer rauszukriegen,
wenn man nicht die betr. Sätze eindeutig identifizieren kann. Gelingt dies,
müßte man die Parameter gegen diese Dinge absichern können.
B.E:
Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329,
D-38023 Braunschweig, Germany
Tel. +49 531 391-5026 , -5011 , FAX -5836
e-mail B.Eversberg at tu-bs.de
Mehr Informationen über die Mailingliste Allegro