[Allegro] problem mit import.exe bei großen datenbanken

Klaus Lehmann lehmann_klaus at t-online.de
So Mär 4 16:48:31 CET 2012


Guten Tag allerseits, 

wie jedes jahr, erzeuge ich für meine bibliotheken eine datenbank mit 
den 6,1 mill. stammdatensätzen der DB: perso,körpi und schlagworte.
die letzten jahre musste die erzeugung mit 16bit-werkzeugen 
durchgeführt werden. dieses ist alles voll auf 32bit umgestellt.
(das wird das letzte mal der fall sein, weil die DB ja ihr angbeot 
völlig umstellt oder umgestellt hat.)


nun passiert etwas merkwürdiges:
================================
man kann das auf http://allegronet.de/import.jpg  (ca 1MB) sehr gut 
sehen. ich habe das jpg NICHT als attachment hier in die email mit 
reingepackt. wer will, muss also extern guggen ;-)


das skrip, wo irgendwas in die hosen geht, lautet an dieser stelle:
import -f5 -dc:\temp\dbc_2012.alg -idbgkddat -epa/c:\temp\GKDCDdt1.alg -ka x2 -s0 -m0 -v0 -h0

die ausgangsdatei c:\temp\dbc_2012.alg ist 2,1GB groß. reines ascii. 
es sind meines wissen keine schweinereien drin ;-) also: klare 
trennungen usw.

die sache läuft über einen filter: dbgkddat.aim
exportiert wird dabei nach c:\temp\GKDCDdt1.alg


und es passsiert:
=================
bei der 13,6millionsten zeile in der dbc_2012.alg. der letzte sauber 
rausexportierte datensatz ist: Workshop on human green.... (rechts im 
bild gut zu sehen).
links im bild sieht man, wie der darauffolgende satz: deutschsprachige 
abaqus.... zerhackstückelt ankommt. 
das feld mab2 "001" wird wohl nur übernommen.


wat iss hier los? ich frage:
=============================
hat import.exe (32bit) sein fassungsvermögen erreicht?
die 13,6millionste zeile wurde eingelesen.
die 1,17millionste zeile (1 zeile=1 datensatz) wurde in gkdcddt1.alg 
wurde geschrieben.

das ganze konnte ich 2x zuverlässig reproduzieren!!!


gegentests:
===========
ich lasse jetzt gerade den teil des skriptes als 16bit import.exe 
durchlaufen. statt einer halben stunde wird er wohl einige stunden 
benötigen.... (das wäre "notlösung 1"). das ergebnis steht noch aus.

als "notlösung 2" könnte ich mir vorstellen, die ausgangsdatei 
dbc_2012.alg in 2 teile zu teilen.


wenn die beiden notlösungen klappen, bedeutet es was????
import.exe (32bit) ist NICHT in der lage, den job zu machen?
nebenbei bemerkt: import16.exe habe ich die jahre vorher benutzt.....

wenn beide notlösungen NICHT klappen, heisst das, der fehler MUSS in 
der ausgangsdatei zu suchen sein.    hm.....


viele grüße zum sonntage,
ihr klaus lehmann

-- 
Mit freundlichen Grüßen,
Ihr Klaus Lehmann
* http://allegronet.de * eMail: allegronet at t-online.de * phone: 03528-452 807(fax 809) * mobil: 0171-953 7843
* allegronet.de * Klaus Lehmann * D-01454 Radeberg * Kleinwolmsdorfer Str. 37
* Software für zufriedene Bibliothekare: 1000x bewaehrt und ergiebig
* Bereits 4x allegro-utf8. Buchen Sie die allegro-Roadshow
* Yes we can. Only with allegro. Yes we do. Always with allegro.
* Internetkataloge & WebHosting für Allegro-C & Web 2.0 with VuFind
* 2011: Sponsor der Peter-Sodann-Bibliothek (Staucha)
* 2012: mit allegro-utf8 V3 und allegro-vufind auf der IFLA in Helsinki




Mehr Informationen über die Mailingliste Allegro