Re: Aufbau großer Datenbanken

Sibylle Koczian Sibylle.Koczian at bibliothek.uni-augsburg.de
Di Jan 14 14:29:11 CET 2003


Lieber Herr Berger,

inzwischen habe ich wenigstens einen Teil der Angaben eingesammelt, die ich 
brauche. Leider das betroffene Datenbankverzeichnis nicht als Textdatei aus 
dir ... > dirtext, sondern als Bildschirmabdruck in Word-Datei und deshalb 
a) schwer lesbar und b) unvollstaendig. Diese Bosheit musste jetzt einfach 
mal raus.

At 16:38 07.01.03 +0100, you wrote:
>Liebe Frau Koczian,
>
> > MAB2-Ausspeicherungen. Die Datenbanken werden also in einem Schritt
> > erstellt: Import der MAB2-Daten in eine .alg-Datei mit den Titeldaten und
> > eine Datei mit den Lokaldaten, Aufbau der Datenbank mit Index aus der
> > Titeldaten-alg-Datei und Zuspielen der Lokaldaten mit Update (die
> > Lokaldaten werden Teil der zugehörigen Titelsätze).
>
>das koennte ein Problem werden.

Ich beginne zu vermuten, dass es das Problem _ist_, mir fehlen aber gerade 
dazu noch Daten. Immerhin sieht es aus, als sei Index glatt durchgelaufen: 
protok und protoq enden regulaer, es gibt keine ii-Dateien mehr, sondern 
eine .adx-Datei.

Zwei Fragen an dieser Stelle: Der qrix-Aufruf am Ende von protok endet mit
... -Pc:\allegro a -x9999
Was bedeutet dieses a? Es steht wirklich so da, nicht -a.

Und am Ende von protoq erscheint der Index-Aufruf für den zweiten 
Durchlauf; allerdings gibt es tatsaechlich keine Stammsaetze in der 
Datenbank (wohl aber die entsprechenden Befehle in den Indexparametern). 
Verewigt sich dieser zweite Durchlauf in einem Protokoll, und in welchem? 
Im Handbuch habe ich nichts dazu gefunden.

upro habe ich mir dummerweise nicht geben lassen (vergessen wegen des 
unvollständigen Verzeichnisses).

> > Die Groesse der bei Index entstehenden Zwischendateien richtet sich nach
> > dem verfuegbaren Arbeitsspeicher und ist nicht einstellbar, habe ich das
> > richtig verstanden?
>
>Ja. Sind diese aber sehr klein, waere das schlimm. Ca. 70-80kB sollten
>sie normalerweise haben.

Wenn ich die Groesse der .adx-Datei durch die Anzahl der ii-Dateien teile 
(aus protok), dann sieht es aus, als seien sie tatsaechlich kleiner gewesen 
(55 kB). Aber stimmt diese Rechnung?

>Das nicht, aber es koennte zu grosse Datensaetze geben oder zu
>grosse Kategorien (IMPORT hat hier m.W. andere Speicherlimits).

Was waere da die Folge? Gehe ich recht in der Annahme, dass ein Vergleich 
der letzten Saetze von Ausgangs- und .alg-Datei am schnellsten klaert, ob 
hier etwas passiert ist? Die Batch-Datei kann jedenfalls nicht mit IMPORT 
abgebrochen sein, die beiden Importe kommen vor INDEX.


>Das wichtigste: Ist es die Indexierung der Titel, oder kommen die
>Probleme erst beim Einmischen der Lokaldaten?

Da warte ich jetzt auf upro, und ausserdem werde ich mir doch die Rohdaten 
geben lassen. Die liebe Redaktion hatte mich ausserdem schon vor langer 
Zeit gebeten, die urspruenglich eingebaute zusaetzliche Protokollierung zu 
entfernen, und ich Depp habe das gemacht, statt es ihnen auszureden.

Danke und beste Gruesse, Koczian


Dr. Sibylle Koczian
Universitaetsbibliothek , Abt. Naturwiss.
D-86135 Augsburg

Tel.: (0821) 598-2400, Fax : (0821) 598-2410
e-mail : Sibylle.Koczian at Bibliothek.Uni-Augsburg.DE





Mehr Informationen über die Mailingliste Allegro