[Allegro] problem mit import.exe bei großen datenbanken
Klaus Lehmann
lehmann_klaus at t-online.de
So Mär 4 16:48:31 CET 2012
Guten Tag allerseits,
wie jedes jahr, erzeuge ich für meine bibliotheken eine datenbank mit
den 6,1 mill. stammdatensätzen der DB: perso,körpi und schlagworte.
die letzten jahre musste die erzeugung mit 16bit-werkzeugen
durchgeführt werden. dieses ist alles voll auf 32bit umgestellt.
(das wird das letzte mal der fall sein, weil die DB ja ihr angbeot
völlig umstellt oder umgestellt hat.)
nun passiert etwas merkwürdiges:
================================
man kann das auf http://allegronet.de/import.jpg (ca 1MB) sehr gut
sehen. ich habe das jpg NICHT als attachment hier in die email mit
reingepackt. wer will, muss also extern guggen ;-)
das skrip, wo irgendwas in die hosen geht, lautet an dieser stelle:
import -f5 -dc:\temp\dbc_2012.alg -idbgkddat -epa/c:\temp\GKDCDdt1.alg -ka x2 -s0 -m0 -v0 -h0
die ausgangsdatei c:\temp\dbc_2012.alg ist 2,1GB groß. reines ascii.
es sind meines wissen keine schweinereien drin ;-) also: klare
trennungen usw.
die sache läuft über einen filter: dbgkddat.aim
exportiert wird dabei nach c:\temp\GKDCDdt1.alg
und es passsiert:
=================
bei der 13,6millionsten zeile in der dbc_2012.alg. der letzte sauber
rausexportierte datensatz ist: Workshop on human green.... (rechts im
bild gut zu sehen).
links im bild sieht man, wie der darauffolgende satz: deutschsprachige
abaqus.... zerhackstückelt ankommt.
das feld mab2 "001" wird wohl nur übernommen.
wat iss hier los? ich frage:
=============================
hat import.exe (32bit) sein fassungsvermögen erreicht?
die 13,6millionste zeile wurde eingelesen.
die 1,17millionste zeile (1 zeile=1 datensatz) wurde in gkdcddt1.alg
wurde geschrieben.
das ganze konnte ich 2x zuverlässig reproduzieren!!!
gegentests:
===========
ich lasse jetzt gerade den teil des skriptes als 16bit import.exe
durchlaufen. statt einer halben stunde wird er wohl einige stunden
benötigen.... (das wäre "notlösung 1"). das ergebnis steht noch aus.
als "notlösung 2" könnte ich mir vorstellen, die ausgangsdatei
dbc_2012.alg in 2 teile zu teilen.
wenn die beiden notlösungen klappen, bedeutet es was????
import.exe (32bit) ist NICHT in der lage, den job zu machen?
nebenbei bemerkt: import16.exe habe ich die jahre vorher benutzt.....
wenn beide notlösungen NICHT klappen, heisst das, der fehler MUSS in
der ausgangsdatei zu suchen sein. hm.....
viele grüße zum sonntage,
ihr klaus lehmann
--
Mit freundlichen Grüßen,
Ihr Klaus Lehmann
* http://allegronet.de * eMail: allegronet at t-online.de * phone: 03528-452 807(fax 809) * mobil: 0171-953 7843
* allegronet.de * Klaus Lehmann * D-01454 Radeberg * Kleinwolmsdorfer Str. 37
* Software für zufriedene Bibliothekare: 1000x bewaehrt und ergiebig
* Bereits 4x allegro-utf8. Buchen Sie die allegro-Roadshow
* Yes we can. Only with allegro. Yes we do. Always with allegro.
* Internetkataloge & WebHosting für Allegro-C & Web 2.0 with VuFind
* 2011: Sponsor der Peter-Sodann-Bibliothek (Staucha)
* 2012: mit allegro-utf8 V3 und allegro-vufind auf der IFLA in Helsinki
Mehr Informationen über die Mailingliste Allegro