Aufbau großer Datenbanken

Thomas Berger ThB at gymel.com
Mi Jan 15 11:21:16 CET 2003


Liebe Frau Koczian,


> - Die Datei UPRO ist leer. Bedeutet das, dass Update sofort
> zusammengebrochen ist, oder wird UPRO erst am Ende erzeugt? Es ist
> allerdings andererseits so, dass sich die Zeitstempel derjenigen
> .ald-Dateien, die entstanden sind, ueber ca. 20 Stunden hinziehen. Das
> wuerde zu Ihrer Zeitschaetzung unten gut passen und sieht jedenfalls aus,
> als muesste Update eine Zeitlang gelaufen sein.

UPRO wird m.W. direkt am Anfang zum Schreiben geoeffnet (ist
dann leer), konkret hineingeschrieben wird erst am Ende,
ausser Sie haben Schalter -x, -R etc. gesetzt. Es sieht
also ziemlich sicher danach aus, dass Update nach einiger
Zeit gekracht ist (falls nicht die Indexierung 20h gedauert
hat, was bei einer Datenbankgroesse von 1,5Mio Titeln und
unguenstigen Parametern natuerlich auch sein kann. Aber
das sehen Sie ja am Vergleich der PROTOK-Daten mit denen
der .ALD-Datei).

 
> - Der Zusammenbruch erfolgte mit blauem Bildschirm und damit ohne eine
> brauchbare Fehlermeldung.

BSD oder blaues DOS-Fenster?

 
> - Mir faellt auf, dass ein Teil der Dateien das Archiv-Attribut hat, und
> daraus schliesse ich, dass waehrend des Aufbaus ein Sicherungsprogramm
> gelaufen sein duerfte. Das kann nicht den sofortigen Zusammenbruch bewirkt
> haben (Zeitstempel) und Update sollte sich wohl nicht davon stoeren lassen
> (?), aber gut scheint es mir nicht.

Ich habe mich nie drum gekuemmert, welche Allegro-Module den
Archiv-Stempel setzen/loeschen. Gesetzt bedeutet "muss erneut
gesichert werden". Nicht gesetzt *koennte bedeuten*: Seit
der Indexierung nicht veraendert.


 
> At 17:24 14.01.03 +0100, you wrote:
> >Schwer vorstellbar: Gibt es doch nur einen Lokalsatz pro Titel
> >oder werden die Lokal-Informationen beim Import irgendwie "entzerrt",
> >denn sonst muessten sie sich doch ueberschreiben?
> >
> 
> Entzerren: was im fertigen Satz Wiederholungskategorie werden soll, wird
> als #xx~ importiert. Bei den kleineren Mengen, bei denen ich es bisher
> naeher angesehen habe, klappt das auch einwandfrei. Die Lokalsaetze
> enthalten im uebrigen nicht viel (Signatur, Exemplarzahl, ggf.
> Bestandsangaben und Fussnoten, das war's schon so ziemlich),
> und  Zeitschriftenbaende werden abweichend vom Rest als eigene Saetze
> behandelt.

das kann aber doch - vor allem in der Haeufung - ziemlich lange
Schluessel ergeben, nicht wahr?


...
> Ich bin nicht voellig sicher, ob wir uns gerade richtig verstehen: mir
> scheint, ein Perlskript, das mit zwei Textdateien ungefaehr das tun soll,
> was Update mit einer fertigen Datenbank und einer Textdatei tut, kann die
> Situation nur verschlechtern.

Naja, Update macht da normalerweise nichts falsch. Einige
zig Stunden schneller koennte die Sache mit Perl natuerlich
schon werden...


 
> > > (Allenfalls wenn ich ganz sicher sein koennte, dass die Lokalsaetze nach
> > > der ID-Nr. des zugehoerigen Titelsatzes geordnet kommen - dann vielleicht.)
> >
> >Ein Sortierprogramm ist Ihr Freund :-)
> 
> Haben Sie einen Tipp, wo ich danach am besten suchen kann (es geht ja nicht
> mit asort o.ae., weil nicht zeilenweise sortiert werden kann)?

Alle Sortierprogramme sortieren Zeilen. (Ach so: Sie haben
die MAB-Daten nicht als MAB, sondern als MAB-Diskette. Ts. Ts.)

viele Gruesse
Thomas Berger




Mehr Informationen über die Mailingliste Allegro