[Allegro] Höllenfahrt findet vorerst nicht statt

Bernhard Eversberg ev at biblio.tu-bs.de
Mo Mai 13 11:00:51 CEST 2013


Am 13.05.2013 09:58, schrieb Thomas Berger:
> 1. So umrüsten, daß UTF-8 innerhalb A.CFG möglichst weitgehend verwendet
>      werden kann. Dazu müssen wohl gewisse Modifikationen in a99 sein,
>      was die Umcodierung angeht. Parameter und Workflow für eine
>      Migration erstellen bzw. verbessern. Siehe dazu:
>        http://www.allegro-c.de/unicode//index.htm#meth2
> Warum diese und nicht die andere Methode?
Weil Fremddaten i.a.R. UTF-8 (s.u.) sind und damit dann weniger 
Konvertieraufwand entsteht.

> 2. Unterstützende Funktionen (weiter)entwickeln, die erforderlich sind,
>      um a99 zu ergänzen, wo es mit UTF-8 nicht umgehen kann. Die Eingabe-
>      felder können nun mal nicht auf Unicode umgerüstet werden!!! Es gibt
> Sie tun wieder so, als gaebe es auf Windows-Rechnern keine Beispiele
> von Software mit Eingabefeldern, die mit Unicode arbeitet.
Nein, ich sage nur, daß es mit dem Programmiersystem, das wir nun mal 
haben, also Visual C++ , nur mit 16bit-Zeichen machbar wäre, aber solche 
Felder können wir in unseren Quellen nicht handhaben und solche Daten 
nicht in .ALD speichern. Falls es Ihnen dennoch gelingen sollte, 
übernähmen wir das mit Dank und Anerkennung.

>> 4. Prüfen, ob die alte M-Konfiguration aktualisiert werden sollte, um sie
>>      als Alternative bereitstellen zu können. Wobei allerdings die Anwendung
>>      von aLF, ORDER und ZAboM auf A.CFG beschränkt bleiben dürfte.
> was meinen Sie mit "M": "U" oder "N"?
Damit war "U" gemeint, sorry, Verwechslung.

> Book MARC Records that were generously donated from the Scriblio 
> project (http://about.scriblio.net) at Plymouth State University. 
> These records are originally from the Library of Congress for their 
> holdings. What Is Scriblio? Scriblio (formerly WPopac) is an award 
> winning, free, open source CMS and OPAC with faceted searching and 
> browsing features based on WordPress. Scriblio is a project of 
> Plymouth State University, supported in part by the Andrew W. Mellon 
> Foundation. ThB: "originally LC" != "original LC"
Ja, so ist das wohl. Das richtige MARC21 mit allen Zeichensatz-Finessen 
(MARC-8) könnten wir
weder verlustfrei umwandeln noch intern handhaben, da darf man sich 
nichts vormachen. Auch deswegen ist UTF-8 - was ja bei LC die 
Alternative ist - das Medium der Wahl.
Hier:
   http://datahub.io/de/dataset?q=library+of+congress
findet man dieselben Daten, gleichfalls mit unzureichender Aufklärung 
über deren Charakter, und daß die Daten von 2007 sind.
Wir nutzen das Zeug auch nur zum Testen, vor allem um weitere 
Verbesserungen in MARC21.AIM zu erarbeiten. Denn in 7 Mio Daten findet 
man allerhand Beispiele. (Der eigentliche LC-Datenbestand ist durchaus 
noch größer)
Nur nebenbei: Unternehmungen wie datahub.io und lod-cloud.net sind gut 
gemeint, aber was die uns interessierenden Daten angeht, noch nicht 
recht befriedigend. (Die berühmte Datenwolke wurde zudem zuletzt Sept. 
2011 aktualisiert.) In datahub fehlt zudem meist eine Angabe zum Datum 
der Erstellung der Daten.
Die Authority-Daten bietet LC selber an:
   http://id.loc.gov/download/
Hier jedoch nicht MARC, sondern RDF in den Varianten MADS und SKOS.

B.E.






Mehr Informationen über die Mailingliste Allegro