[Allegro] Zum Thema GND, 2+3: Wesen und Struktur

Fr Mär 30 13:15:34 CEST 2012

Lieber Herr Eversberg,

> Sie haben ja in vielem recht. Ihre umfänglichen Ausführungen zeigen
> nachdrücklich, auf was für eine komplexe Materie man sich da einläßt.
> Und das zugleich mit den Regelwerks- und Formatumstieg.

Naja, es gibt Gruende, fuer die Normdaten mit der MARC-Einfuehrung
vorzupreschen. Bzw. da ist der Leidensdruck besonders gross gewesen.

> Ob das angesammelte Erkenntnisgut nun in einer den "Dingen an sich"
> angemessen Weise überzeugend zum Durchbruch und einem wirklichen
> Wissensmanagement entscheidend näherkommt, scheint unter all den
> gegebenen Prämissen zumindest nicht extrem aussichtsreich.
> Wer die Gesamtsituation mit heutigem Anspruch und Durchblick
> überschaut, könnte sogar verzagen. GND verbessert zwar das
> Potential der Daten, aber zunächst nur theoretisch, die Inhalte sind
> ja erst mal dieselben. Ohne Integration mit VIAF wird's kaum weit

Die Inhalte sind bereits ab dem Start verschieden, sonst koennte
man sich ja an einer Datenumsetzung per "Schnittstelle" versuchen.
Die von Ihnen erwaehnten Entitaetscodes z.B. sind so derzeit
nicht alle vorhanden oder direkt ableitbar, sie werden nach aufwendigen
Heuristiken aus den Altdaten ermittelt. Es wird also in den
drei alten Normdateien eine Art Data Mining betrieben, um implizit
vorhandenes fuer die GND explizit zu machen.

> vorangehen, doch VIAF, andererseits, ist ohne GND zustande gekommen.

Den Einwand verstehe ich nicht wirklich. VIAF ist tragfaehig, weil
das Konzept "Person" (philosophisch hoechst komplex ist, aber)
international relativ einheitlich in die divesen Normdateien
eingeflossen ist.

Bei Koerperschaften ist es wegen der zeitlichen Erstreckung schon
deutlich komplizierter, analog dem Verhaeltnis ZDB <-> ISSN
versucht man aber ueber Harmonisierung der "Splitregeln" ebenfalls
zu einem einheitlichen Entitaetenbegriff zu kommen (ob hingegen Schiffe
oder Kongresse nun Koerperschaften oder ein eigener Entitaetstyp
sind, ist eigentlich eine Nebensaechlichkeit, Hauptsache man
kann bei Bedarf erkennen, worum es sich handelt)

>>> 2. Was sind und was sollen Normdaten?
>>> -------------------------------------
>>> Normdaten sollen Benennungen festlegen, also Namen oder Bezeichnungen
>>> für Gegenstände der Anschauung und des Denkens, für Begriffe und
>>> Personen, Körperschaften, abstrakte Vorstellungen, Themen, Ideen,
>>> Konzepte, Werke, Geographische Regionen. Jede benennungsbedürftige
>>
>> Wenn nicht falsch, doch zumindest fragwuerdig, weil es sich so
>> liest als ginge es um die Benennungen, die wir als "Ansetzung"
>> kennen.
> 
> Ja, das scheint oft so gemeint zu sein. Natürlich muß man
> auseinanderhalten, und ich dachte das versucht zu haben, zwischen
> dem "Ding an sich", bekanntlich stets unsicht-, wenngleich benennbar,
> der unter mehreren zu bevorzugenden Benennung (preferred name) und dann
> deren Schreibung (Ansetzung, die ja der nackten Benennung auch noch
> Elemente hinzufügen kann). Und nur um letztere geht's doch
> *in unserem Kontext*! Höhere Ansprüche als das Einbringen von
> brauchbaren, normierten Benennungen in unsere Register und ein paar
> Synonymen etc. können wir doch in unserem bescheidenen Rahmen gar nicht

Na, und ob!

Ueber ISBNs koennen wir auf Titelscans oder Inhaltsverzeichnisse
verlinken, ueber PND-Nummern mittels PND-BEACON auf inzwischen
deutlich mehr als 100 verschiedene Angebote, sehr viele davon
nichtbibliothekarisch.

Dabei ist es voellig irrelevant, ob ich die Person "Mueller, Peter
<1990-, Buchhaendler>" nenne und die Nachbarbibliothek "Mueller,
Piet <Buchhaendler, 1990->" und Musicbrainz oder die Wikipedia
ihn als "DJ PeMue" kennen.

Bei der GND-Einfuehrung geht es doch ganz stark darum, dass in
den Normdaten schon allerhand steckt, mit dem auch die
bibliothekarischen Anwender mehr machen koennten als einheitliche
Karteikarten in einheitlicher Ablagefolge zu produzieren, wenn
nicht die traditionellen (insbesondere MAB-) Formate genau
diese Hilfsfunktion fuer "korrekte" Titeldaten so in den Vordergrund
stellten.

> bedienen. Komplexe semantische Struturen abbilden und funktionabel
> machen im Wissensqualm des Netzes? Naja, good luck. [Google setzt ja
> entschieden mehr auf Statistik als auf Normierung. Uns ist ein solcher
> Weg mangels Datengrundlage u.a. nicht gegeben. Das nur nebenbei.]

VIAF macht das genau so: Sich auf Ansetzungen zu verlassen, waere
aussichtslos, Lebensdaten sind eher zur Verhinderung von (falschen)
Identifikationen brauchbar, extrem viel "Wissen" wird aus dem
mitzuliefernden Kontext (also verknuepfter Literatur) abgeleitet.

> Und:
>> ... fuer die zugehoerige
>> Ansetzung interessiert sich allerdings eher niemand, bzw. die kann
>> man ja von id.loc.gov oder VIAF erfragen...
> 
> Vom manuellen erfragen müssen will man ja eben wegkommen und die Daten
> programmtechnisch interoperabel machen. (Wem sage ich das?)

Ich kann die LCCN in eine URL packen und das Resultat maschinell
auswerten:

http://lccn.loc.gov/n95096250

http://id.loc.gov/authorities/names/n95096250.html

http://viaf.org/viaf/sourceID/LC%7Cn+95096250

(und m.W. kann ich jede der URLs durch gewisse Modifikationen dazu
bringen, statt HTML etwas guenstiger verarbeitbares auszuspucken)

>>>   einer 035. Software kann jederzeit daraus die URI fabrizieren.
>> Klar. Sie muss nur wissen wie.

> Das ist es ja eben! Das "wie" kann sich ändern. Und dann sieht die URI
> alt aus. Eine Änderung in der Software behebt das Problem, statt daß
> man Millionen URIs änderte - was ja sonst fällig würde, und auch
> da muß man wissen wie. (Wem sage ich das?)

http://d-nb.info/gnd/121145344

ist von den Traegern der PND und der GND als "Persistenter Identifier"
deklariert. Dahinter steckt natuerlich das Versprechen der Institution,
diese HTTP-URIs in Zukunft operabel (im URL-Sinn) zu halten. Das ist
just gestern ja auf Inetbib noch einmal bekraeftigt worden.

>> Aber auch GKD und SWD enthielten "-" in den Identnummern und waren
>> daher in allegro nicht direkt nutzbar (dort nur Buchstaben und
>> Ziffern erlaubt).
> Den Bindestrich können Sie da doch weglassen, die letzte Ziffer ist
> nicht signifikant. Und über die weiteren Möglichkeiten der allegro-
> Parametrierung muß ich Sie doch nicht aufklären.

"(588)121145344" /ist/ nun aber signifikant.

Und "-" weglassen geht nur, wenn ich die Genese und Semantik der
Normdatennummern fuer jede der einzelnen Normdateien (oder der ISBN)
kenne, mein Programm muss also insbesondere a priori alles dazu
wissenswerte wissen. Weil aber Identifier eigentlich "opak" sein
sollten, gibt es dazu gar nichts wissenswertes, und weil neue
Identifier auch ohne Datenformat- und Softwareupdates nutzbar
sein sollen, ist das ein weiterer Grund.

viele Gruesse
Thomas Berger