[Allegro] ToC-Dienst: Kataloganreicherung durch Webservices aus Linked Open Data

Thomas Berger ThB at Gymel.com
Di Mai 25 14:42:36 CEST 2010


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Liebe Liste,

[Drei Buzzwords allein im Betreff: Wer kommt drueber ;-)]

Cover-Scans und gescannte Inhaltsverzeichnisse sind beliebte
Instrumente bei der Kataloganreicherung:

Die Cover-Abbildungen sind schoen augenfaellig und haben auch einen
Wiedererkennungs-Nutzen (wenn man das Buch im Laden trifft oder eine
Bibliothek benutzt, die die Schutzumschlaege am Objekt laesst ;-),
ausserdem ist die Erlaubnis, diese im OPAC einzubinden, auch dieses Jahr
wieder per Vertrag zwischen dbv und der VG Bild Kunst bis zum Ende
des Jahres verlaengert worden [Soweit ich das ueberblicke, betrifft
die Erlaubnis aber nicht den Tatbestand des Selber-Einscannens von
Covern, nur das Im-Katalog-Zeigen von Covern aus dritten Quellen, die
das wiederum duerfen: Bibliotheksverbuende haben anscheinend die
Moeglichkeit, die kostenguenstig einzukaufen].
Wer sich bislang scheute, amazon-Bilder einzubinden (die sind ja an einen
Link zu amazon gebunden), kann die Bilder (m.W.) frei via Google Book
Search einbinden (die Verlinkung dorthin ist m.W. erstens optional und
zweitens mit weiterem Mehrwert verbunden, zumindest wenn dort dann die
Moeglichkeit zur Volltextsuche und/oder Teile des Werks zum Online-Lesen
angeboten werden).

Gescannte Inhaltsverzeichnisse gleichen ein wenig das Defizit fehlender
Aufsatzkatalogisierung aus, das wird mittlerweile von allen
Bibliotheksverbuenden im grossen Stil betrieben, bei der Uebernahme von
Fremddaten sind die URLs dann auch in MAB 655 mitgeliefert.
[Fuer grosse Bibliotheken ist das billig in den Workflow einzubauen, da
eine Scan-Infrastruktur wg. Dokumentlieferdiensten normalerweise bereits
besteht]

Im Maerz haben einige Bibliotheken den Gesamtbestand ihrer Titel- und
Normdaten als Linked Open Data veroeffentlicht und unter die Lizenz
"CC0" gestellt: Jegliche Nutzung und Weiterverarbeitung ist ohne
irgendwelche Bedingungen gestattet.

Aus diesen Daten konnte ich einfach die URLs der gescannten Inhaltsverzeichnisse
zu ca. 330.000 verschiedenen ISBNs extrahieren:

HBZ [327.000], LBZ-RLP [1.500], SWB [76], BVB [28], GBV [7], ÖBV [3], Hebis [0]
DNB [3.700], LoC [1]

(Die Zahlen zeigen m.E., dass in "den Verbuenden" die Fremddatenuebernahme -
ausser DNB - und gegenseitige Katalogisatanreicherung nicht besonders
stringent praktiziert wird, (aber das wird sich ja sofort aendern, wenn wir
ab naechstem Jahr ohne MARC-Konvertierungsaufwand AACR-Daten in unsere
Kataloge pusten)

Aus dieser Konkordanz ISBN<->URL des Inhaltsverzeichnisses habe ich einen
SeeAlso-Webservice aufgebaut, der als "Mashup" in den eigenen OPAC einen
Link auf ein Inhaltsverzeichnis einbauen kann, ohne dass das Katalogisat
den Link explizit enthaelt (es funktioniert halt anhand der ISBN):

http://beacon.findbuch.de/articles/isbn-toc

Der Dienst ist frei nutzbar, bis mein Server in die Knie geht, sollte das
passieren, muss geschaut werden, ob er nicht gespiegelt werden kann um die
Last besser zu verteilen.

Hinweise auf andere offene Datenquellen nehme ich gerne entgegen, der HBZ-
und Fach- Bias des derzeitigen Datenbestands steht der Nutzung etwas
entgegen (Die Veroeffentlichten Daten stammen alle von Bibliotheken im
HBZ-Verbund, "universal" ist davon nur der KUG, also der Gesamtkatalog
der UStB Koeln, die zweischichtig war oder ist und dementsprechend sind
die Daten der einzelnen Faecher unterschiedlich reich).

viele Gruesse
Thomas Berger







-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (Cygwin)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iJwEAQECAAYFAkv7xbwACgkQYhMlmJ6W47O6YQP+KXNA3lHr7J5oOVUQGa/OvecA
zpdngBId0kMOSXQIP/xYtE4mgjOEdPH7jkRUOlAsQgk9KZZ3n9u/Mas0Befn3T8Q
B3c9XycSLblysX1EGtEkQof9kx/GBdmxZ5SVm+a1n4rqaBCaD2Q/m0w/7de3WoIx
2grK0rEAz3YNH1Duie8=
=IFc7
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro