[Allegro] Fremddaten per dnb.flx - was ist davon zu halten?

Bernhard Eversberg ev at biblio.tu-bs.de
Mi Jul 25 08:48:27 CEST 2012


Mit V32.6 kam ein neuer FLEX namens dnb.flx.
Wenn man  X dnb  gibt, wird nach ISBN oder Stichwörtern gefragt, und
man kriegt die passenden Daten von der DNB. Das beruht letztlich auf
dem URI (Uniform Resource Identifier)   http://d-nb.info/satznummer,
mit der man eine Anzeige des formatierten Datensatzes bekommt.
Einfach mal probieren:
   X dnb    eingeben, dann
   schulden 5000     oder    graeber schulden
um das Buch "Schulden : die ersten 5000 Jahre" von David Graeber
zu katalogisieren.

ABER:
Der FLEX  dnb.flx  ist ein kleines Experiment und ein Beispiel, wie
man solche formatierten Anzeigen, obwohl sie so nicht gedacht sind,
quasi als Web-Service mißbrauchen kann. In diesem Fall so, daß die
Daten aus der HTML-Quelldatei herausgeklaubt und zu einem Datensatz
montiert werden. Natürlich mit allerhand Unvollkommenheiten.
(Uralt, diese Methodik, früher "screen scraping" genannt. In diesem
Fall etwas weniger direkt, besser aber kaum.)

Rückfragen zeigen, daß man dazu ein paar deutliche Worte sagen muß:
Dies ist keine verläßliche Methodik zur Fremddatenübernahme! Ein URI
ist kein URL, sondern sowas wie eine ISBN, nur "eindeutiger", nämlich
wirklich eindeutig, nicht nur manchmal. So wie die ISSN im Gegensatz
zur ISBN. Und Eindeutigkeit ist der einzige Sinn des URI! Sie muß gar
nicht wie ein URL aussehen, aber wenn sie es tut, dann nur, weil
eine URL "von Natur aus" weltweit eindeutig ist. Und sowas braucht
man im Netz, will man Datensätze unmißverständlich benennen.
Auch und vor allem Normsätze! Die neue GND-Nummer reicht dafür alleine
nicht hin, aber wenn man  http://d-nb.info/gnd/  davorsetzt, dann ist
sie auf einmal weltweit eindeutig!
Mehr, um das nochmal zu betonen, mehr will und soll ein URI nicht! Der
Rest ist Software, d.h. was diese dann damit macht.
Daß tatsächlich formatierte Daten kommen, wenn man sie im Browser
eingibt, das ist ein Sonderservice der DNB, den sie jederzeit ändern
oder abschaffen kann!!! Deshalb nochmals: dnb.flx  ist keine
verläßliche Methodik zur Fremddatenübernahme.
Dennoch und nichtsdestotrotz hielten Anfrager, die ein paar kleine
Verbesserungen wünschten, diese Neuerung für die beste Erfindung,
die man in Frankfurt je gemacht habe: Endlich ein unkomplizierter
und "sauschneller", gezielter und kostenfreier Zugriff auf
DNB-Sätze, direkt aus allegro, ohne Umschweife à la Zack, und nicht
nur per ISBN wie bei zDirekt, sondern mit bequemer Einwurfschlitz-
suche.

Großes Kompliment für Frankfurt - aber die haben das nicht so gemeint,
siehe oben.

Je nun, die gewünschten kleinen Verbesserungen, z.B. hinsichtlich
mehrteiliger Werke oder URLs für Inhaltsverzeichn., waren leicht
zu lösen und wurden schnell erledigt. Denn z39 (zc.flx) geht bei DB
nicht mehr auf bisherige Art, vermutlich Umstellung auf SRU:
   http://www.dnb.de/DE/Service/DigitaleDienste/SRU/sru.html
Theoretisch wäre SRU natürlich eine oder die saubere Lösung,
wohl aber nicht per Schnellschuß zu erledigen und ganz kostenfrei auch
nicht.
Dem ist noch nachzugehen, aber mit dnb.flx haben wir einen ganz
kleinen, temporären Notbehelf, der vielleicht schon jetzt gleich oder
heute nachmittag nicht mehr geht. (Will nur sagen: Keine Euphorie
jetzt!)
Hier der verbesserte FLEX (zum Kopieren in Ihren FLEX-Ordner):

   http://ftp.allegro-c.de/aktuelle-version/dnb.flx

Nebenbei entdeckt:
Es gibt neuerdings ein Metadatenformat "DNB Casual", auf oai_dc
fußend. Nach Registrierung kann man damit wohl jetzt auch Daten
kostenfrei online beziehen:
 
http://www.dnb.de/DE/Standardisierung/Formate/DNBCasual/dnbcasual_node.html
Auch dem wäre noch nachzugehen. (Aber müssen wir das alles selber
machen?)




Mehr Informationen über die Mailingliste Allegro