[Allegro] Höllenfahrt findet vorerst nicht statt
Bernhard Eversberg
ev at biblio.tu-bs.de
Mo Mai 13 11:00:51 CEST 2013
Am 13.05.2013 09:58, schrieb Thomas Berger:
> 1. So umrüsten, daß UTF-8 innerhalb A.CFG möglichst weitgehend verwendet
> werden kann. Dazu müssen wohl gewisse Modifikationen in a99 sein,
> was die Umcodierung angeht. Parameter und Workflow für eine
> Migration erstellen bzw. verbessern. Siehe dazu:
> http://www.allegro-c.de/unicode//index.htm#meth2
> Warum diese und nicht die andere Methode?
Weil Fremddaten i.a.R. UTF-8 (s.u.) sind und damit dann weniger
Konvertieraufwand entsteht.
> 2. Unterstützende Funktionen (weiter)entwickeln, die erforderlich sind,
> um a99 zu ergänzen, wo es mit UTF-8 nicht umgehen kann. Die Eingabe-
> felder können nun mal nicht auf Unicode umgerüstet werden!!! Es gibt
> Sie tun wieder so, als gaebe es auf Windows-Rechnern keine Beispiele
> von Software mit Eingabefeldern, die mit Unicode arbeitet.
Nein, ich sage nur, daß es mit dem Programmiersystem, das wir nun mal
haben, also Visual C++ , nur mit 16bit-Zeichen machbar wäre, aber solche
Felder können wir in unseren Quellen nicht handhaben und solche Daten
nicht in .ALD speichern. Falls es Ihnen dennoch gelingen sollte,
übernähmen wir das mit Dank und Anerkennung.
>> 4. Prüfen, ob die alte M-Konfiguration aktualisiert werden sollte, um sie
>> als Alternative bereitstellen zu können. Wobei allerdings die Anwendung
>> von aLF, ORDER und ZAboM auf A.CFG beschränkt bleiben dürfte.
> was meinen Sie mit "M": "U" oder "N"?
Damit war "U" gemeint, sorry, Verwechslung.
> Book MARC Records that were generously donated from the Scriblio
> project (http://about.scriblio.net) at Plymouth State University.
> These records are originally from the Library of Congress for their
> holdings. What Is Scriblio? Scriblio (formerly WPopac) is an award
> winning, free, open source CMS and OPAC with faceted searching and
> browsing features based on WordPress. Scriblio is a project of
> Plymouth State University, supported in part by the Andrew W. Mellon
> Foundation. ThB: "originally LC" != "original LC"
Ja, so ist das wohl. Das richtige MARC21 mit allen Zeichensatz-Finessen
(MARC-8) könnten wir
weder verlustfrei umwandeln noch intern handhaben, da darf man sich
nichts vormachen. Auch deswegen ist UTF-8 - was ja bei LC die
Alternative ist - das Medium der Wahl.
Hier:
http://datahub.io/de/dataset?q=library+of+congress
findet man dieselben Daten, gleichfalls mit unzureichender Aufklärung
über deren Charakter, und daß die Daten von 2007 sind.
Wir nutzen das Zeug auch nur zum Testen, vor allem um weitere
Verbesserungen in MARC21.AIM zu erarbeiten. Denn in 7 Mio Daten findet
man allerhand Beispiele. (Der eigentliche LC-Datenbestand ist durchaus
noch größer)
Nur nebenbei: Unternehmungen wie datahub.io und lod-cloud.net sind gut
gemeint, aber was die uns interessierenden Daten angeht, noch nicht
recht befriedigend. (Die berühmte Datenwolke wurde zudem zuletzt Sept.
2011 aktualisiert.) In datahub fehlt zudem meist eine Angabe zum Datum
der Erstellung der Daten.
Die Authority-Daten bietet LC selber an:
http://id.loc.gov/download/
Hier jedoch nicht MARC, sondern RDF in den Varianten MADS und SKOS.
B.E.
Mehr Informationen über die Mailingliste Allegro