[Allegro] GND- und Titeldaten der DNB zum Download

Bernhard Eversberg ev at biblio.tu-bs.de
Mi Jun 6 09:07:35 CEST 2012


Frankfurt macht langsam Ernst mit GND und Open Data.
Gestern hat man bekanntgegeben (Jörg Prante, DNB):

-----------------------------------------------------------------------
The German National Library (DNB) has released the GND in an RDF Turtle
Dump under a CC0 license. More information:

http://www.dnb.de/DE/Service/DigitaleDienste/LinkedData/linkeddata_node.html

    -> Download der Linked Data Dumps

What does that mean? Well, each of us can download a GND base set in
RDF, put it into a search engine, for example into Elasticsearch (it
took only a few minutes for indexing 9.493.987 subject
URI-based documents consisting of a total of 97.267.642 triples), or
into a triple store like 4store, and start locally using GND as a
source for authority control and for mixing up and building
mashups with other bibliographic and non-bibliographic data.
-----------------------------------------------------------------------


Klingt ja sehr charmant: "start locally using GND as a source for
authority control", und in Minutenschnelle sind 10 Mio. Daten
indexiert, hört hört! Allein das Umwandeln mit IMPORT würde doch
ein paar Viertelstunden länger brauchen...
Ob wir in unsrem Kontext damit was anfangen könnten? Das nun
freigegebene Format ist noch mal was ganz anderes, kein MARC
und kein MAB, sondern RDF in der sog. Turtle-Notation (die braucht
etwas weniger Platz), XML-codiert und mit allerhand neuen Bezeichnungen
statt Kategorienummern, hier mal ein Beispiel:

<http://d-nb.info/gnd/7505786-4>
       a       gnd:SubjectHeading ;
       gnd:complexSeeReferenceSubject
               <http://d-nb.info/gnd/4039634-4> , 
<http://d-nb.info/gnd/4309802-2> ;
       gnd:geographicAreaCode
 
<http://d-nb.info/standards/vocab/gnd/geographic-area-code#XA> ;
       gnd:gndIdentifier "7505786-4" ;
       gnd:gndSubjectCategory
               <http://d-nb.info/vocab/gnd-sc#10.2ea> , 
<http://d-nb.info/vocab/gnd-sc#10.9a> , 
<http://d-nb.info/vocab/gnd-sc#10.4> ;
       gnd:oldAuthorityNumber
               "(DE-588c)4273804-0" , "(DE-588c)7505786-4" ;
       gnd:preferredNameForTheCorporateBody
               "Europäische Gemeinschaften / Wirtschaftsunion / 
Währungsunion" .


Das ließe sich relativ leicht importieren, aber ob das *Sinn* ergäbe?
(Unsere GND-MARC-Umwandlung ist ja nun wohl schon wieder obsolet!?)
Sondern besser statt dessen eine Suchmaschine oder sog. "triple store"
aufsetzen und diesen dann zum Suchen und Ermitteln der richtigen
Namen und Schlagwörter nutzen? Denn was wir auf dem Gebiet so machen,
wird ja wohl langsam doch altmodisch.

Neue Basis für Normdaten - Wär das nicht ein Thema für's 
Expertentreffen? Freiwillige vor ...

B.E.






Mehr Informationen über die Mailingliste Allegro