import-Fehler
Wolfgang Glaser
glaser at tumx2.biblio.tu-muenchen.de
So Okt 6 23:52:14 CEST 1996
Bernhard Eversberg wrote:
> Satzes erkennen kann. Wenn die Zeichenfolge des re-Befehls nicht
> stimmt, kann das nicht klappen. Das Programm liest und liest und
> findet kein Ende - das kann letztlich zum Crash fuehren.
> Vermutlich sind also die Swets-Daten, die in Muenchen vorliegen,
> in der Struktur anders als die, die uns vorlagen. Untersuchen Sie,
> wie das Satzende wirklich aussieht.
> Am re-Befehl liegt es nicht. Die Einzeltitel sind offenbar wirklich zu lang. Von 19 untersuchten Dateien
machten 7 Probleme. Als ich aus diesen die entsprechenden Titel herausnahm, klappte alles problemlos.
Bei den umfangreichen Titeln handelt es sich meistens um Kongresse, die in Zeitschriften erscheinen. z.B. in
der Datei sw950706.ful war der Titel Biochemical Society Transactions 23(1995)2 enthalten. Der Auszug betrug
immerhin 48620 Bytes mit 285 Aufsatzstiteln. Der umfangreichste Titel war in sw950710.ful enthalten, nämlich
Journal of cerebral blood flow and metabolism 25(1995)1 Suppl. mit 194371(!) Bytes, d.h. 874 Aufsatztiteln.
In der Datei sw950724.ful waren sogar drei zu goße Titel enthalten:
IEEE Trans.appl. superconductivity 5(1995)21; 44322 Bytes, 347 Titel
IEEE Trans.appl. superconductivity 5(1995)23; 57710 Bytes; 333 Titel
Surface Science and Surf.Sci.Lett. 331(1995)B; 43194 Bytes; 263 Titel;
Die Grunddateien haben immer eine Größe von 500kB bis 1,5MB; die zu großen Titel gehen ab 26kB aufwärts.
Das Herauspräparieren der pathologischen Titel ist bei einer Produktion nicht machbar, zumal dann auch die mit
interessantesten Titel fehlen würden. Mit Klimmzügen könnte man zwar auch die wieder einbringen, aber eben nur
mit Klimmzügen.
Web-allegro für SwetScann macht einen sehr guten Eindruck, auch was die Geschwindigkeit betrifft. Probeweise
habe ich jetzt ca 16MB Rohdaten verarbeitet, und es wäre schade, wenn das Projekt an den zu großen Dateien
scheitern müßte.
Mit oben gemachten Angaben müßte doch auch in Braunschweig nachzuvollziehen sein, was dort mit den großen
Dateien passiert, falls SwetScan im Einsatz ist.
mfG Glaser
Mehr Informationen über die Mailingliste Allegro