[Allegro] import.exe 32bit ist machbar

Thomas Berger ThB at Gymel.com
Mi Nov 18 17:33:13 CET 2009


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg, liebe Liste,


> Die obligatorische Machbarkeitsprüfung hat ergeben:
> Die Umwandlung des Importprogramms ist nicht schwierig.
> Man wird aber, wie im Falle index.exe, auf die Interaktivität
> des DOS-Programms verzichten müssen, insbes. die Auswahl der
> Parameterdatei und der zu importierenden Datei. Diese müssen
> dann mit den Optionen  -i  bzw.  -d  angegeben werden, die
> Exportparameter und Ergebnisdatei mit -e.
> M.a.W.: Import 32bit wäre ein reines Komnsolprogramm.
> Dies scheint uns akzeptabel, oder gibt es Einwände?

Es gab da noch ein Detail am Rande, dass manche Importe auf
zurueckliegende Datensaetze zurueckgreifen mussten, und
das funktionierte nur bei -m1. Ich fand das immer etwas
undurchsichtig, habe solche Features auch nie benoetigt,
kann gerne darauf verzichten.

32bit-Programm ist auch aus einem anderen Grund wichtig,
seit laengerem war IMPORT.EXE das Programm, das am hungrigstem
nach DOS-Arbeitsspeicher war, immer mehr Anwendungen musste
ich so umstricken, dass Importe stets mit einer speziell
abgespeckten .CFG durchgefuehrt wurden.

Ich habe neulich beilaeufig ein "Gotcha" bei ISO-2709-Importen
bemerkt, dass sich mit "etwas mehr Speicher", sprich zusaetzlichem
Umkopieren des Arbeitstextes wohl guenstig umschiffen liesse:

Fuer MARC21-Importe im ANSEL-Zeichensatz hatte ich per y-Tabelle
Zeichen auf Hilfszeicehen umgesetzt, die dann per globaler Ersetzung
auf Zweizeichen-Kombinationen (etwa die Ligatur OE, die Ostwest nicht
kennt) gebracht wird. Dies ging jahrelang gut, bis dann tatsaechlich
einmal ein Datensatz mit dieser Ligatur kam: Der war voellig
verstuemmelt, weil anscheinend die globale Ersetzung (im Gegensatz
zur Lokalen) den Rohdatensatz im Arbeitsspeicher veraendert und
dann das Directory nicht mehr zu den Daten passte.

Ich haette auch nichts dagegen, wenn das ISO-2709-Handling auf ein
zusaetzliches Utility verlagert werden koennte: In Ihrem Vortrag
zu vuFind haben Sie ja auch geschildert, dass die Saetze als menschenlesbarer
Text exportiert wurden, und dann mit dem interaktiven (brrr) MarcEdit
in ISO 2709 verwandelt wurden. Ich persoenlich mache diese Konversion
stets mit einem Perlskript (und auch den umgekehrten Weg, es ist ja
oft nuetzlich, ISO 2709-Daten ~ansehen~ zu koennen, bevor die eigentlich
erst zu entwickelnden Importparameter darauf losgelassen werden).
Analog gehe ich auch bei MABXML und aehnlichem vor: Auch hier lasse ich
nicht die Importparameter auf die XML-Datei los, sondern bringe sie
zunaechst (mit XSLT aus Windows-Bordmitteln) in etwas MAB-Diskette-artiges,
das sich dann gut importieren laesst.

Weil die Positionierung so verschieden ist (s 0 "tag"  vs. D0 "tag"),
benoetigt man derzeit sowieso (mindestens) zwei verschiedene Varianten
des MARC-Imports, das ist auch nicht so angenehm:

Langer Rede kurzer Sinn: Eine Rohform fuer ISO-2709-Dateien verabreden
(Feldende = CRLF, Satztrenner CRLF CRLF, ansonsten alles unveraendert,
insbesondere also das Unterfeldzeichen bereits als 31 codiert) und
ein Mini-Programm bereitstellen, das eine allgemeine Konversion zwischen
ISO2709-Daten (evtl. auch degenerierten wie MAB2) und "textifizierten"
beherrscht, evtl. auch in beide Richtungen. Dann Directory-Formate aus
der Funktionalitaet von IMPORT.EXE herauskegeln.

[Am Rande: ISO2709 ist mir erst einmal als absolut zwingend begegnet
(abgesehen vom ZTarget), und zwar im Kontext eines Exports nach UNIMARC.
Hier ist der Zeichensatz zwar ISO5426 und nicht ANSEL, die "gaengigen"
Systeme scheinen aber noch viel schlechter auf Lesbare Daten in Formaten
jenseits der bibliothekarischen Nischenspezfikation eingestellt zu sein]

viele Gruesse
Thomas Berger










> 
> B.Eversberg
> 
> 
> ------------------------------------------------------------------------
> 
> _______________________________________________
> Allegro mailing list
> Allegro at biblio.tu-bs.de
> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.3-nr1 (Windows XP)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iQCUAwUBSwQhyWITJZieluOzAQKyCgP4hPReDfwh04h+BWg1WGiSc0/RcUO+rAL1
wi01b+eBqK96A/K3vkjAhnuxi+kBxLcKPC2O9/Ncu9ysgrcjjnA/8bB2MsKAX0aW
w0JhoFJYsjjszJmaQoOLVbiVwITyrVOazJ+MsSV3xfRTVyrLFuMPlsj8DLMW+Mji
5QRU4Avyww==
=IvwD
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro