[Allegro] Gemeinsame Normdatei: Entscheidungen stehen an

Thomas Berger ThB at Gymel.com
Di Jun 14 11:46:04 CEST 2011


Lieber Herr Eversberg, liebe Liste,

> Fehlt nur noch Beispielmaterial. Leider wirft einem DNB nur
> eine Datei im Original-MARC vor die Füße, ohne weitere Hinweise:
> 
>   http://files.d-nb.de/standards/gnd_testmarc21gnd

Wenn man nicht ueber "Standardisierung", sondern ueber "Service"
/ "Datendienst" einsteigt, findet man bei der DNB einen Link
auf diverse Testdaten:

http://www.d-nb.de/service/zd/datendienst.htm

http://datendienst.d-nb.de/cgi-bin/mabit.pl?userID=testdat&pass=testdat&cmd=login

darunter auch MARCXML-Darstellungen enstsprechend der alten Aufteilung
der Normdateien in GKD, PND, SWD, z.B. also

http://datendienst.d-nb.de/cgi-bin/mabit.pl?cmd=fetch&userID=testdat&pass=testdat&mabheft=PNDtestmrc.xml



> Die Normsätze haben in MARC21 allesamt an Position 6 das 'z',
> Titelsätze haben dort ein 'a' (wenn's z.B. ein Buch ist).
> Dieses 'z' hat zur Folge, daß 100, 110, 111, 130, 400, 410 usw.
> nicht dasselbe bedeuten wir in bibliobraphischen Sätzen - eine
> ungute Eigenschaft von MARC, die das Handhaben von Titel- und
> Normdaten innerhalb einer Datenbank ein wenig erschwert, das nur
> nebenbei, weil Berger schrieb
> "... Datenfelder gleichen Inhalts haben zwingend dieselbe Nummer
> und Felder mit gleicher Nummer haben dieselbe Bedeutung"

Nun, auch die MARC21-Familie hat mehrere Formate: Fuer Titel,
fuer Authorities, fuer Holdings, etc. Es sind aber bereits deutlich
weniger als die Formate in der MAB2-Familie.

Die Uebereinstimmung bei "100" u.a. ist vermutlich sogar gewollt,
in 100 des Titelformats steht der (persoenliche) Verfasser, unter dem
die Schrift anzusetzen ist, in 100 des Normdatenformats die Ansetzungs
form, wenn es sich um eine Person handelt...



> Ferner ist anzumerken, daß mit dem Übergang zu MARC21 in der von
> DNB ausgearbeiteten Form zwar Die Kontinuität mit den bisherigen
> Daten gewahrt bleibt, diese also vollinhaltlich rüberkommen in
> das neue Format, daß aus eben diesem Grunde aber keine Kompatibilität
> inhaltlicher Art mit dem MARC21-Normformat der LC erreicht wird.
> Je nun - beides zusammen geht nicht. RSWK-Schlagwörter z.B. sind zu
> LCSH nun mal nicht entfernt ineinander konkordanzierbar.
> Bessere internationale Austauschbarkeit wird somit nur auf rein
> formaler Ebene erreicht, nicht auf der entscheidenden inhaltlichen.

Nun, die RSWK wurden letztes Jahr schnell geaendert, damit solche
Daten ueberhaupt in MARC transportierbar sind, aber das nur am Rande.

Prioritaer war m.E. fuer die "Internationalisierung", dass man die
Entitaeten angleicht, d.h. wenn irgendeinem Format ein technischer
Datensatz kommt, dann kann man davon ausgehen, dass man konzeptionell
lt. eigenem Regelwerk auch einen Datensatz benoetigt. Fuer die GKD
ist da m.W. einiges zu tun gewesen. (Konzepte wie "Ansetzung" und
"Verweisungsform" waren schon immer gemeinsam, FRAD-inspirierte
Normdateien werden da mittelfristig eine Aenderung bringen, indem
sie auch auf Datensatzebene staerker [und besser] zwischen abstrakten
Sachverhalten, wie etwa einer Person mit ihren Spuren in der Realitaet
und den Benennungen dieses Sachverhalts, also den Namen der Person
in verschiedenen bibliographischen Teillandschaften, unterscheiden:
Von der Idee, zu weltweit gueltige "Ansetzungen" fuer Personen und
Koerperschaften und erst recht Schlagworte zu konvergieren, hat man
sich in den letzten 15 Jahren voellig verabschiedet...)

Auf der naechsten Stufe muss man Kohaerenz bei den fundamentalen Steuer-
schrauben herstellen, also z.B. zwischen Personen und Familien, zwischen
"normalen" Koerperschaften, Kongressen und Gebietskoerperschaften
unterscheiden, damit das Format nicht voellig falsch bedient wird. Das
ist in den letzten Jahren ueberwiegend maschinell durch Anreicherung
der vorhandenen Normdaten um "Entitaetscodes" geschehen.

Auf der naechsten Stufe der Regelwerke oder sogar der konkreten Anwendungen
(Normdateien) muss man dann ueberlegen, was "internationale Austausch-
barkeit" bedeuten mag. Es ist nicht geplant, die eine Anwendung abzuschaffen
und durch die andere Anwendung auszutauschen. Man wird auch nicht einen
Datensatz unbearbeitet uebernehmen koennen und er entspricht automatisch
dem eigenen Regelwerk. MARC21 ist jedoch, bei allen Schwaechen, wesentlich
eher geeignet, heterogene Information zu transportieren, weil in fast
jedem Datenfeld Quelle und Kontext (im Prinzip ein "Namespace"-Konzept
mit Registries und allem) vermerkt sind. Insofern kann man einen MARC-
Satz uebernehmen, um eine eigene Identnummer anreichern und erst einmal
nutzen (vergleichbar mit Prae-RAK-Retrokonversionsdaten). Oder man kann
ihn umarbeiten aufs eigene Regelwerk, und zwar hautpsaechlich durch
Ergaenzen von Feldern, man muss nichts altes manuell wegredigieren: Auch
das ist eine Arbeitsersparnis und Saetze bleiben konkordant.

Bereits jetzt sind Personen in der PND vorzugsweise nach LoC-NA
anzusetzen, d.h. NACO wird routinemaessig konsultiert und dann
abgeschrieben (auf diese Art ist bereits eine 5stellige Zahl formal
falscher LoC-NA-Nummern in die PND gekommen: Alles Verschreiber...),
diese Prozesse lassen sich demnaechst vereinfachen. M.E. ist die
Frage, ob Verweise bei Personen um Lebensdaten in $d der MARC21-
Felder angereichert werden muessen oder ob das eine Frage der AACR2-
Anwendung ist, theoretisch nie geklaert worden: An der Stelle steht
die Austauschbarkeit mit der konkreten Normdatei NACO/NAF viel
staerker im Vordergrund als irgendwelche Ueberlegungen, die Aussage
dass MARC21 ein regelwerksunabhaengiges Format ist, einem Belastungs-
Test zu unterziehen.

Auf gewisse Weise ist die PND (die Personen in der GND) wesentlich
moderner, denn durch das Nadeloehr MAB liess sich individualisierende
Information nur in Ordnungshilfen zur Ansetzung transportieren und
nach RAK war das nicht erwuenscht (nach RSWK teilweise erwuenscht).
Insofern ist die PND fruehzeitig zu einer biographischen Datenbank
entwickelt worden, wo diese Information fuer sich in eigenen Daten-
feldern untergebracht ist, seit einigen Jahren gilt dabei auch
offiziell, dass zwar immer noch oekonomisch vorzugehen ist, aber
bekannte Informationen (im Nachschlagewerk X finde ich auf einen
Schlag drei Fakten, lt. Regelwerk benoetige ich aber nur eines
davon und musste die beiden anderen frueher unterschlagen) stets
eingetragen werden duerfen.

Nach AACR2 hingegen wird nach Moeglichkeit individualisiert und
MARC21 erlaubt den Transport der Ansetzung in durch Unter-
felder substrukturierter Form. Insofern hat man sich dort nie
von der Idee der Individualisierung durch verbesserte Ansetzung
loesen brauchen, leidet allerdings jetzt unter Diskussionen
(ernsthaft!), ob man Sterbedaten ueberhaupt nachtragen darf,
weil das ueberall die Ansetzungen verhagelt (Verknuepfungsnummern
hat man aus demselben Grund nie fuer notwendig erachtet). Dafuer
aber enthalten die NACO-Saetze sehr sorgfaeltige Hinweise darauf,
aufgrund welcher Vorlage oder welchem NYT-Nachruf die einzelnen
Fakten in den Normsatz geraten sind, waehrend man in der PND
oft nur raetseln kann, wie ein Satz zustandegekommen ist und ob
man ihn entsorgen darf.

Mein Eindruck ist, dass man die MARC21-Einfuehrung bei den Normdaten
inzwischen durchaus separat von den uebrigen Transformationen betrachten
kann: Das MAB-Format ist hier einfach vor vielen Jahren schon als
Hemmnis einer sinnvollen Fortentwicklung (z.B. Zusammenfuehrung zur
GND) erkannt worden und international dieselben Entitaetenregeln zu
haben macht extrem viel Sinn. "MARC must die" gilt gewiss auch in diesem
Bereich, d.h. es war weise, die beliebte Trennung zwischen Intern-
Format der wichtigsten Anwendung und Austauschformat beizubehalten,
dass nach 20 Jahren Ruecksichtnahme auf RAK/MAB und stueckweisen
Erweiterungen sich ausserdem ein Redesign des Internformats anbot
und man sich dafuer vom zukuenftigen Austauschformat hat inspirieren
lassen, kann ich ebenfalls gut nachvollziehen.

viele Gruesse
Thomas Berger



Mehr Informationen über die Mailingliste Allegro