[Allegro] Höllenfahrt findet vorerst nicht statt

Bernhard Eversberg ev at biblio.tu-bs.de
Mo Mai 13 08:41:36 CEST 2013


Zur Umfrage vom 8.5.

Eine erste Vorauswertung läßt erkennen, daß die Antwort 4a äußerst selten,
wenn überhaupt, gegeben wurde. Vielmehr wird sich davon oftmals deutlich
distanziert.
1a (UTF-8) dagegen tritt überraschend oft auf, d.h. hier deutet sich ein
Handlungsbedarf an.
Auch nicht selten ist 2c (A.CFG beibehalten, aber verbessern), aber MARC21
wird nicht rundweg abgelehnt.

Zu einem sinnvollen Vorgehen scheinen daher vier Punkte zu gehören:

1. So umrüsten, daß UTF-8 innerhalb A.CFG möglichst weitgehend verwendet
     werden kann. Dazu müssen wohl gewisse Modifikationen in a99 sein,
     was die Umcodierung angeht. Parameter und Workflow für eine
     Migration erstellen bzw. verbessern. Siehe dazu:
       http://www.allegro-c.de/unicode//index.htm#meth2

2. Unterstützende Funktionen (weiter)entwickeln, die erforderlich sind,
     um a99 zu ergänzen, wo es mit UTF-8 nicht umgehen kann. Die Eingabe-
     felder können nun mal nicht auf Unicode umgerüstet werden!!! Es gibt
     da nur die 16bit-Option, die kommt aber KEINESfalls in Betracht!!!
     Nur die RTF-Anzeige kann Unicode. Also müssen wir schauen, was unter
     diesen Randbedingungen noch möglich ist. Auch a35 spielt da eine Rolle.
     (Der Index kann UTF-8, aber kann solche Daten nicht korrekt ordnen!
     Damit ist einem nur bei chinesischen Titeln gedient, wovon Oxford seit
     je regen Gebrauch macht.)

3. MARC21-Umwandlung verbessern, in beiden Richtungen.

4. Prüfen, ob die alte M-Konfiguration aktualisiert werden sollte, um sie
     als Alternative bereitstellen zu können. Wobei allerdings die Anwendung
     von aLF, ORDER und ZAboM auf A.CFG beschränkt bleiben dürfte.

Eine Taskforce ist bereits drauf angesetzt und nimmt heute die Arbeit auf.
Einige Monate Geduld noch!

Nebenbei:
Zu 3. wurden Daten gesichtet, die jetzt die LC freigegben hat:
   http://ia600508.us.archive.org/13/items/marc_records_scriblio_net/
Dort liegen 29 Dateien mit insges. ca. 7 Mio MARC-Datensätzen der LC.
(Unkomprimiert, Original MARC-Struktur)
Genauere Inspektion zeigt, daß hinsichtlich Zeichencodierung das
Material sehr zu wünschen übrig läßt. Es ist nicht UTF-8, aber auch nicht
der eigentliche MARC-Standard mit Esc-Sequenzen - womit allegro
sowieso nicht umgehen könnte. Angewendet werden Esc-Sequenzen
anscheinend nur für Exponentenziffern, z.B. bei chemischen und
mathematischen Symbolen! Deutsche Titel sind ok, allerdings ist dafür der
Bedarf bei uns ja nicht so groß. Brauchbar dürften demnach nur das
Material in den lateinisch geschriebenen europäischen Sprachen sein.
Naja!
Das Umwandeln mit marc21.aim gelingt immerhin auf Anhieb.

B.E.




Mehr Informationen über die Mailingliste Allegro