[Allegro] Zum Thema GND, 2+3: Wesen und Struktur
Bernhard Eversberg
ev at biblio.tu-bs.de
Fr Mär 30 08:40:00 CEST 2012
Zum Thema GND
=============
2. Was sind und was sollen Normdaten?
-------------------------------------
Normdaten sollen Benennungen festlegen, also Namen oder Bezeichnungen
für Gegenstände der Anschauung und des Denkens, für Begriffe und
Personen, Körperschaften, abstrakte Vorstellungen, Themen, Ideen,
Konzepte, Werke, Geographische Regionen. Jede benennungsbedürftige
Gegebenheit ist für das neue Datenmodell eine "Entität". Etwas
knapper könnten wir sagen: "Entität" ist alles, was einen
Normdatensatz bekommen kann. (Je nun, das wäre zwar nicht besser als
Einsteins Diktum "Zeit ist das, was eine Uhr mißt", aber die Physik ist
an der Stelle auch noch nicht weiter.) Dazu gehören nach dem bisherigen
Verständnis Personen, Körperschaften, Werke und Sachbegriffe, wobei die
ersten drei auch zum Thema eines Werkes werden und damit zugleich
unter die Sachbegriffe fallen können. Darin liegt eins der größeren
Probleme, denn für Sachbegriffe waren bislang die RSWK zuständig, deren
Prinzip "Deutschsprachigkeit" diametral zur "Originalsprachigkeit"
der RAK-WB steht. Das erstere gewinnt! Und dies unter den Auspizien der
Globalisierung und der Zielvorstellung, im Metadaten-Weltkonzert besser
kommunikabel zu werden? Was jedoch so oder so nur gelingen kann,
wenn das Konzept VIAF - bisher nur für Personennamen in Betrieb -
integriert wird und das Umschalten zwischen den Sprachwelten übernimmt.
Von VIAF ist im GND-Umfeld bislang nicht die Rede, aber das muß kommen.
Die Feldgruppe 7XX wäre der Ort, eine VIAF-Nummer anzusiedeln.
Weil die Formatreform einhergehen soll mit einer Regelwerksreform, und
zwar dem Umstieg auf die sog. RDA, ist der Umlernbedarf nicht gering,
das ganze Unternehmen sehr komplex und nicht durch einen einmaligen
Kraftakt zu erledigen. Wenig verständnisfördernd ist auch, daß noch
obendrein eine Begriffsreform angezettelt wird.
Dazu später mehr, im jeweiligen Kontext.
Jetzt mal erst Klartext und so knapp wir möglich:
Was soll eine Normdatenstruktur leisten? Ganz grob vier Dinge:
1. Klassifizieren
Die zu normierenden Gegebenheiten (Entitäten) sinnvoll gruppieren
2. Normieren
Eindeutige Benennungen festlegen
3. Gleichsetzen
Andere, gleichwertige Benennungen aufführen
4. Querverweisen
Beziehungen zu anderen Entitäten angeben
Hinzu treten natürlich noch ein paar verfeinernde und beschreibende
Aspekte.
3. Was für Datenelemente braucht ein Normsatz?
----------------------------------------------
Die vier Grundfunktionen entsprechen vier einfachen Fragen, die ein
Normsatz beantworten soll:
1. Was für eine Entität liegt vor und ist zu beschreiben?
Dafür hat GND Typbezeichnungen, die sog. "Entitätencodes".
Diese stehen 1stellig im MARC-Feld 079 $b (Pica3: 005 Tx)
und präziser (3stellig) in 079 $v (Entitäten-Untergliederung,
Pica 3: 008)
Mindestens 4 große Gruppen sind zu unterscheiden, für jede davon
gab es bisher eine eigene Normdatei:
Personen: PND, Körperschaften: GKD, Werke: DMA, Sachbegriffe: SWD
Zwei Großgruppen betrachet GND gesondert:
Geografika (ja, so schreiben die das) incl. Gebietskörperschaften
und Kongresse.
Die Großgruppen zerfallen in zahlreiche kleinere, deshalb braucht
man die 3stelligen Codes. Hier sind sie gelistet:
https://wiki.d-nb.de/download/attachments/51283696/entitaetencodierung_2012-03-12_gnd.pdf?version=1&modificationDate=1331911693000
2. Wie soll die Entität offiziell heißen, oder genauer, mit welchem
Namen oder Term soll sie verbindlich bezeichnet werden? Das leistet
die "bevorzugte" Benennung (preferred name/name). Sofort
schließt sich die Frage an: Wie ist diese Benennung genau zu
schreiben? Diese Schreibweise nannten wir bislang "Ansetzungsform".
In RDA gibt es dafür den "authorized access point"; über die beste
deutsche Übersetzung ist wohl noch nicht befunden. Wir könnten
provisorisch weiter von der "Ansetzungsform" reden. Sonst könnte man
auch "Normform" sagen oder "Normbenennung".
GND: 1XX
3. Welche gleichwertigen, anderslautenden oder anders buchstabierten
Bezeichnungen sind wichtig und sollen deshalb auffindbar sein?
(Synonyme, Pseudonyme, Kurzformen, ...)
Klassisch sprach man von "Verweisungsformen", was aber in der
nun allein maßgeblichen Online-Umgebung nicht mehr recht
den Kern der Sache trifft.
GND: 4XX
4. Gibt es Beziehungen der Entität zu anderen Entitäten, und welcher
Art sind sie? Traditionell sprachen wir von "Siehe-auch-Hinweisen",
später von "Verknüpfungen", nun von "Relationen" ("Relationships"),
etwa zwischen Titel und Serie, Titel und Person oder Körperschaft,
Körperschaft und übergeordneter Körperschaft, Unter- und Oberbegriff
sowie Vorgänger und Nachfolger bei Titel- und Namensänderungen o.a.
GND: 5XX
Folgende weiteren Angaben können im Einzelfall hinzutreten:
5. Zeitangaben, Zeitschlagwort (auch Lebensdaten)
GND: 548 $a
6. Sprachcodes, wenn die Sprache von Belang ist
http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/inhaltserschliessung/sprachencodes_iso_639_2.pdf?__blob=publicationFile
GND: 377
7. Geocodes, falls ein geographischer Bezug besteht
http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/inhaltserschliessung/laendercodes_alph.pdf?__blob=publicationFile
GND: 043
8. Art der Aussage: Unterfeld $4, sog. "Relationscode",
Dies kann in versch. Feldern vorkommen, vor allem im Bereich 4.
Es gibt eine verbindliche Liste von derzeit 132 4stelligen Codes:
Die Liste steht z.B. in
https://wiki.d-nb.de/download/attachments/50759357/500.pdf?version=1&modificationDate=1329222967000
Diese entsprechen nicht den "relator codes", die es im MARC der
LC für Personen gibt, die bisher aber selten verwendet wurden, und
zwar nur in Titeldaten, nicht in Normdaten:
http://www.loc.gov/marc/relators/
9. Alternative Vorzugsbenennungen
GND 7XX nimmt Namensformen etc. auf, die anderen Regeln folgen.
Im Unterfeld $0 ist dann die Quelle angegeben, z.B. so:
$0(DLC)n 79003362
Anscheinend steht manchmal NUR dieses Unterfeld drin.
Zuletzt das Allerwichtigste und Unverzichtbarste:
10.Ein Identifikator, i.d.R. eine eindeutige Nummer, die den Satz
adressierbar macht und dank derer man ihn mit Titelsätzen verbinden
(verknüpfen) kann. Dazu hat Pica die "Relationierung" (Nummer wird
zwischen !...! in Datenfeldern der Titelsätze angegeben, allegro
verwendet zumeist _... oder _..._ dafür (V14-Verknüpfungstechnik).
Heute dient der Identifikator auch dazu, eingebaut in eine URI,
den Satz im Netz eindeutig adressierbar und mittels Web-Services
automatisch abrufbar zu machen. GND geht so weit, in 024 eine URI
explizit anzugeben (s.o.). Das ist pure Redundanz, weil das
Eindeutige daran nur die Nummer ist, und die steht ja auch schon in
einer 035. Software kann jederzeit daraus die URI fabrizieren.
(Die URI ist zudem mit der Web-Adresse d-nb.de konstruiert, die
bereits wieder so gut wie obsolet ist.)
Es gibt noch weitere, weniger oft nötige Elemente, sowie zahlreiche
administrative Angaben.
In Pica3 werden die bisherigen Normdatenelemente, vor allem 8XX,
durch die GND-Nummern (mit wenigen Abweichungen) ersetzt. Erstmals
gibt es damit dann in Pica3 auch Unterfelder $x, die im Editor der
WinIBW dann rot aufleuchten. Das wichtige $9g aus GND erscheint in
Pica3 als $g; zumeist ein Ortsname als Ordnungshilfe. Das wirft die
Frage auf:
Was ist überhaupt mit Ordnungshilfen?
-------------------------------------
Hinweggefegt von der Terminologiereform! Der Term und die Spitzklammern
sind weg, aber dafür entschädigt meist ein zusätzliches Relationenfeld,
wie z.B. hier (das ist jetzt mal Pica3):
410 2\$aHistorische Commission$9g:M^ünchen
...
551
\\$0(DE-101)004037952$0(DE-588)1006792-9$aMünchen$aMünchen$4orta$wr$iOrt
410 $9g heißt nur schlicht "Zusatz",
551 enthält in $0 die IdNummer des Geografikums (ja, so schreiben die
das) "München", welches hier mit seinem Relationstyp "orta" andeutet,
ein Ort zu sein.
Ändert sich also mal die Vorzugsschreibweise von München, zieht dies
keinen Änderungsbedarf an dieser und zigtausend weiteren Stellen nach
sich. Es ersprießt hier aber auch das Potential, in anderssprachigen
Systemen den Ortsnamen (oder was es sei) in der systemeigenen Sprache
aufscheinen zu lassen.
Der "Identifizierende Zusatz" erscheint zumeist in $9g ("Zusatz")
oder $n (Nummer, Zählung) oder in $x ("Allgemeine Unterteilung").
Nicht mehr in <...>! Das war ein deutscher Sonderweg, der z.B. unter
XML obskur geworden ist.
Oder, weiteres Beispiel (das ist wieder DeutschMARC):
110 2\$aHerzog-Anton-Ulrich-Museum
...
551 \\$0(DE-101)000428086$0(DE-588)42808-5$aBraunschweig$4orta$wr$iOrt
Hier hat die 551 sogar zwei Relationsnummern, der Relationstyp $4
(auch der ist wiederholbar) ist "orta" = "Ort, allgemein".
(Mehrfachangaben würden aber innerhalb $4 mittels Semikolon gereiht.)
Braunschweig wäre hier keine "Ordnungshilfe" gewesen, der Ortsbezug
ist aber programmtechnisch gleichermaßen nutzbar.
Ach ja, Indikatoren!
--------------------
MARC kennt bei jedem Feld zwei Indikatoren. Das sind i.a.R. Ziffern,
die den Feldinhalt irgendwie differenzieren. In GND sind hier nur
drei wichtige Fälle zu nennen:
1. Bei Titeln der zweite Indikator, der die Anzahl der zu uebergehenden
Zeichen angibt. Statt dessen hätte man auch die in MARC irgendwann
eingeführten Nichtsortierzeichen nehmen können, hat man aber nicht.
2. Bei Personennamen (Felder X00) ist der erste Indikator 0, 1 oder 2
(persönlicher, normaler, Familienname)
3. Bei Gebietskörperschaftsnamen ist der zweite Indikator in den
X10-Feldern eine '1', sonst '2'
Dokumentationen
---------------
Aus dem Füllhorn der Elaborate, auch unter
https://wiki.d-nb.de/display/ILTIS/Informationsseite+zur+GND
nicht erschöpfend ausgebreitet, greifen wir nur drei Sachen raus:
Umfassende Beispielsammlung: (Word-Dateien)
https://wiki.d-nb.de/pages/viewpage.action?pageId=53248243
Das GND-Format kennt sog. "Kernsets" für die Entitätstypen,
das sind jeweils die für den Typ verbindlichen Datenelemente.
Kernsets mit Beispielen findet man hier:
http://www.zeitschriftendatenbank.de/nc/aktuelles/einzelansicht/article/2012-03-01-5738/
Die GND-Implementierung des GBV in Pica3 steht hier:
http://www.gbv.de/bibliotheken/verbundbibliotheken/02Verbund/01Erschliessung/04Formalerschliessung/Normdaten/gnd/Formate/GBVFormat_NormKonk_offiziell_2011_1221_V01.pdf
Im 4. und letzten Teil, nächste Woche, gehen wir auf die Umwandlung
von GND-Daten in allegro-Strukturen ein und stellen dann für das
A-Format eine dafür erstellte Importparameterdatei bereit.
Mehr Informationen über die Mailingliste Allegro