[Allegro] GND- und Titeldaten der DNB zum Download

Thomas Berger ThB at Gymel.com
Fr Jun 8 12:04:53 CEST 2012


Lieber Herr Eversberg, liebe Liste,

> Das geht sowohl in a99 als auch in Web-Katalogen (mit acon). Man muß

Warum sollte ich mir in einem Webkatalog das "mit acon" antun:
Die dortigen Mittel (PHP, Perl, JavaScript, Java, worin auch immer
die Anwendung implementiert ist) haben durch die Bank weg wesentlich
bessere Moeglichkeiten, HTTP-Abfragen abzuschicken und zu verarbeiten,
als acon mit seinem Konzept "oeffne mir eine Internetdatei"...


> jetzt nur Phantasie und Kenntnisse spielen lassen, um sich Anwendungen
> auszudenken, die mit dieser Methodik auf sonstwas zugreifen und es
> innovativ verwenden.

Nun ja, ein Flex-Befehl der JSON-Ergebnisse fuer eine Weiterverarbeitung
vorbereitet, waere nicht schlecht. (Leider ist das ironisch gemeint,
es gibt nichts geeignetes in acon, auf das eine halbwegs komplexe
Datenstruktur abgebildet werden koennte).


> Wichtig ist nur: so etwas taugt für Zwecke der Anzeige und für darauf
> evtl. aufbauende Funktionen. Die Methodik taugt nicht zum Einbezug in
> die allegro-Indexierung, denn dazu ist interne Datenhaltung unabdingbar.

Tatsaechlich? In den 1990er-Jahren hatte ich mal eine Anwendung, die
externe Volltexte verstichwortet mit qrix einem bestehenden Index
hinzugefuegt hat, das duerfte auch heute noch moeglich sein.

Ueber Linked Open Data etwa sind hundertausende von ToCs anhand der
ISBN zugaenglich, eine grosse Zahl davon PDFs mit hinterlegten
OCR-Texten: Die kann man holen, die OCR-Texte extrahieren und dem
eigenen Index hinzufuegen (Man muss es nicht wie das HBZ etwas
grossmaeulig als "Volltextsuche" im OPAC anbieten, aber mit diesen
zusaetzlichen Stichworten kann man allerhand Sammelbaende finden,
die man sonst wohl nicht bemerkt haette)


> Daher die Frage, ob wir für allegro-Anwendungen was anfangen könnten
> mit den nun veröffentlichten Daten von GND und DNB. Die Frage muß nun
> für den gegenwärtigen Zustand mit Nein beantwortet werden. Sowohl Norm-
> wie Titeldaten sind unvollständig (*) - für die Linked-Data-Zwecke
> sollten sie wohl ausreichen, wenn das Ziel eben nur die Verlinkung
> zum Originalsatz bei der DNB oder zu anderen relevanten Quellen ist -
> falls man dafür geeignete Links konstruieren kann...

Wie sieht es denn da bei Phpac aus, gibt es da URLs, mit denen
von aussen gezielt auf interessante Datensaetze, Registerauszuege oder
Ergebnismengen verlinkt werden kann?


> Bei den Normdaten kommt noch hinzu, daß die Bereinig- und Vereinigung
> der Namenssätze noch nicht abgeschlossen ist: es gibt anscheinend noch
> viele PND- neben SWD-Sätzen für identische Personen. Man will sie
> zusammenführen, wobei die SWD-Ansetzung dann "gewinnt", eine
> abweichende PND-Form zur Nebenform wird (alternative form), wie es dem
> Paradigma der deutschen RDA entspricht.

Bitte aufwachen. Die Zusammenfuehrung von PND- und SWD-Personen hat
1998 stattgefunden. Mit Ruecksicht auf Bibliotheksverbuende mit alten
BIS-Systemen wurden Personensaetze mit Sacherschliessungs-Autorisierung
fuer eine Uebergangszeit zusaetzlich im Format MAB-SWD ausgeliefert.
Mit der Einfuehrung der Aleph-Verbundsysteme hat diese Uebergangsloesung
dann aus Versehen Ewigkeitswert bekommen, was dann die "live"-Normdaten-
versorgung per OAI und ONS ab etwa 2009 extrem erschwert hat.

In besseren Zeiten (Mitte 2010) war kurzzeitig der Anteil individiualisierter
Datensaetze in der PND (ganz knapp) oberhalb 50%, seitdem haben allerdings
die Bibliotheksverbuende mehrere Millionen Altdatensaetze in der PND
verklappt (damit das Migrationsszenario klappt) und die waren ueberwiegend
nicht individualisiert. Man hatte wohl seit etwa 2001 ueberall gehofft,
diese Altlasten (aus zuvor separaten Landesbibliographischen Datenbenbanken
und Retrokonversionen der Zentralkataloge) irgendwie im laufenden Betrieb
abzuschmelzen, das ist aber gruendlich danebengegangen, wie man heute
sehen kann.

Normdatenversorgung ist hierzulande stark vertikal organisiert, eine
Aenderung findet irgendwie ins Zentralsystem ILTIS, geht von dort
ueber OAI in die Normdatenpools der Verbuende, die die gesamten
Normdateien spiegeln, und die relevanten Abschnitte davon werden
automatisiert an die Lokalsysteme der Verbundteilnehmer weitergereicht
(da gibt es je nach Hersteller unterschiedliche Modelle).
Auch innerhalb von Universitaetsbibliotheken laufende allegro-Anwendungen
sind von diesem Weg abgeschnitten, mir ist zumindest kein Lokalsystem
bekannt, das Daten noch eine Etage weiter nach unten durchreichen koennte
und keine noch lebende Allegro-Anwendung, die sich selber an irgendeine
Form "kontinuierlicher" Normdatenversorgung angeschlossen hat.

In allegro-Datenbanken kommen Normdaten typischerweise zum Zeitpunkt
ihres Erstgebrauchs per Einzeldownload (Normdaten-CD, Abschreiben von
irgendwo, Download aus dem Aleph/PICA/XY-Verbundclient, direkter
Download aus der DNB) und da bleiben sie dann jahrzehntelang
unveraendert. Mit der Oeffnung des SRU-Interfaces fuer Normdaten
(kostenfrei nach Anmeldung) bzw. linked open Data gibt es nun halbwegs
komfortable Moeglichkeiten, 1. festzustellen ob ein Normsatz noch
aktuell ist und 2. die lokale Variante durch gezieltes Herbeiholen
der momentan gueltigen Variante zu aktualisieren: Noch eine nuetzliche
Anwendung also.

viele Gruesse
Thomas Berger



Mehr Informationen über die Mailingliste Allegro