[Allegro] Zum Thema GND, 2+3: Wesen und Struktur

Bernhard Eversberg ev at biblio.tu-bs.de
Fr Mär 30 08:40:00 CEST 2012


Zum Thema GND
=============

2. Was sind und was sollen Normdaten?
-------------------------------------
Normdaten sollen Benennungen festlegen, also Namen oder Bezeichnungen
für Gegenstände der Anschauung und des Denkens, für Begriffe und
Personen, Körperschaften, abstrakte Vorstellungen, Themen, Ideen,
Konzepte, Werke, Geographische Regionen. Jede benennungsbedürftige
Gegebenheit ist für das neue Datenmodell eine "Entität". Etwas
knapper könnten wir sagen: "Entität" ist alles, was einen
Normdatensatz bekommen kann. (Je nun, das wäre zwar nicht besser als
Einsteins Diktum "Zeit ist das, was eine Uhr mißt", aber die Physik ist
an der Stelle auch noch nicht weiter.) Dazu gehören nach dem bisherigen
Verständnis Personen, Körperschaften, Werke und Sachbegriffe, wobei die
ersten drei auch zum Thema eines Werkes werden und damit zugleich
unter die Sachbegriffe fallen können. Darin liegt eins der größeren
Probleme, denn für Sachbegriffe waren bislang die RSWK zuständig, deren
Prinzip "Deutschsprachigkeit" diametral zur "Originalsprachigkeit"
der RAK-WB steht. Das erstere gewinnt! Und dies unter den Auspizien der
Globalisierung und der Zielvorstellung, im Metadaten-Weltkonzert besser
kommunikabel zu werden? Was jedoch so oder so nur gelingen kann,
wenn das Konzept VIAF - bisher nur für Personennamen in Betrieb -
integriert wird und das Umschalten zwischen den Sprachwelten übernimmt.
Von VIAF ist im GND-Umfeld bislang nicht die Rede, aber das muß kommen.
Die Feldgruppe 7XX wäre der Ort, eine VIAF-Nummer anzusiedeln.

Weil die Formatreform einhergehen soll mit einer Regelwerksreform, und
zwar dem Umstieg auf die sog. RDA, ist der Umlernbedarf nicht gering,
das ganze Unternehmen sehr komplex und nicht durch einen einmaligen
Kraftakt zu erledigen. Wenig verständnisfördernd ist auch, daß noch
obendrein eine Begriffsreform angezettelt wird.
Dazu später mehr, im jeweiligen Kontext.

Jetzt mal erst Klartext und so knapp wir möglich:
Was soll eine Normdatenstruktur leisten? Ganz grob vier Dinge:

1. Klassifizieren
    Die zu normierenden Gegebenheiten (Entitäten) sinnvoll gruppieren

2. Normieren
    Eindeutige Benennungen festlegen

3. Gleichsetzen
    Andere, gleichwertige Benennungen aufführen

4. Querverweisen
    Beziehungen zu anderen Entitäten angeben

Hinzu treten natürlich noch ein paar verfeinernde und beschreibende
Aspekte.


3. Was für Datenelemente braucht ein Normsatz?
----------------------------------------------
Die vier Grundfunktionen entsprechen vier einfachen Fragen, die ein
Normsatz beantworten soll:

1. Was für eine Entität liegt vor und ist zu beschreiben?
    Dafür hat GND Typbezeichnungen, die sog. "Entitätencodes".
    Diese stehen 1stellig im MARC-Feld  079 $b (Pica3: 005 Tx)
    und präziser (3stellig) in 079 $v (Entitäten-Untergliederung,
    Pica 3: 008)
    Mindestens 4 große Gruppen sind zu unterscheiden, für jede davon
    gab es bisher eine eigene Normdatei:
    Personen: PND, Körperschaften: GKD, Werke: DMA, Sachbegriffe: SWD
    Zwei Großgruppen betrachet GND gesondert:
    Geografika (ja, so schreiben die das) incl. Gebietskörperschaften
    und Kongresse.
    Die Großgruppen zerfallen in zahlreiche kleinere, deshalb braucht
    man die 3stelligen Codes. Hier sind sie gelistet:
 
https://wiki.d-nb.de/download/attachments/51283696/entitaetencodierung_2012-03-12_gnd.pdf?version=1&modificationDate=1331911693000

2. Wie soll die Entität offiziell heißen, oder genauer, mit welchem
    Namen oder Term soll sie verbindlich bezeichnet werden? Das leistet
    die "bevorzugte" Benennung (preferred name/name). Sofort
    schließt sich die Frage an: Wie ist diese Benennung genau zu
    schreiben? Diese Schreibweise nannten wir bislang "Ansetzungsform".
    In RDA gibt es dafür den "authorized access point"; über die beste
    deutsche Übersetzung ist wohl noch nicht befunden. Wir könnten
    provisorisch weiter von der "Ansetzungsform" reden. Sonst könnte man
    auch "Normform" sagen oder "Normbenennung".
    GND: 1XX

3. Welche gleichwertigen, anderslautenden oder anders buchstabierten
    Bezeichnungen sind wichtig und sollen deshalb auffindbar sein?
    (Synonyme, Pseudonyme, Kurzformen, ...)
    Klassisch sprach man von "Verweisungsformen", was aber in der
    nun allein maßgeblichen Online-Umgebung nicht mehr recht
    den Kern der Sache trifft.
    GND: 4XX

4. Gibt es Beziehungen der Entität zu anderen Entitäten, und welcher
    Art sind sie? Traditionell sprachen wir von "Siehe-auch-Hinweisen",
    später von "Verknüpfungen", nun von "Relationen" ("Relationships"),
    etwa zwischen Titel und Serie, Titel und Person oder Körperschaft,
    Körperschaft und übergeordneter Körperschaft, Unter- und Oberbegriff
    sowie Vorgänger und Nachfolger bei Titel- und Namensänderungen o.a.
    GND: 5XX

Folgende weiteren Angaben können im Einzelfall hinzutreten:

5. Zeitangaben, Zeitschlagwort (auch Lebensdaten)
    GND: 548 $a

6. Sprachcodes, wenn die Sprache von Belang ist
 
http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/inhaltserschliessung/sprachencodes_iso_639_2.pdf?__blob=publicationFile
    GND: 377

7. Geocodes, falls ein geographischer Bezug besteht
 
http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/inhaltserschliessung/laendercodes_alph.pdf?__blob=publicationFile
    GND: 043

8. Art der Aussage: Unterfeld $4, sog. "Relationscode",
    Dies kann in versch. Feldern vorkommen, vor allem im Bereich 4.
    Es gibt eine verbindliche Liste von derzeit 132 4stelligen Codes:
    Die Liste steht z.B. in
 
https://wiki.d-nb.de/download/attachments/50759357/500.pdf?version=1&modificationDate=1329222967000
    Diese entsprechen nicht den "relator codes", die es im MARC der
    LC für Personen gibt, die bisher aber selten verwendet wurden, und
    zwar nur in Titeldaten, nicht in Normdaten:
      http://www.loc.gov/marc/relators/

9. Alternative Vorzugsbenennungen
    GND 7XX  nimmt Namensformen etc. auf, die anderen Regeln folgen.
    Im Unterfeld $0 ist dann die Quelle angegeben, z.B. so:
    $0(DLC)n 79003362
    Anscheinend steht manchmal NUR dieses Unterfeld drin.

Zuletzt das Allerwichtigste und Unverzichtbarste:

10.Ein Identifikator, i.d.R. eine eindeutige Nummer, die den Satz
    adressierbar macht und dank derer man ihn mit Titelsätzen verbinden
    (verknüpfen) kann. Dazu hat Pica die "Relationierung" (Nummer wird
    zwischen  !...!  in Datenfeldern der Titelsätze angegeben, allegro
    verwendet zumeist  _... oder  _..._ dafür (V14-Verknüpfungstechnik).
    Heute dient der Identifikator auch dazu, eingebaut in eine URI,
    den Satz im Netz eindeutig adressierbar und mittels Web-Services
    automatisch abrufbar zu machen. GND geht so weit, in 024 eine URI
    explizit anzugeben (s.o.). Das ist pure Redundanz, weil das
    Eindeutige daran nur die Nummer ist, und die steht ja auch schon in
    einer 035. Software kann jederzeit daraus die URI fabrizieren.
    (Die URI ist zudem mit der Web-Adresse  d-nb.de  konstruiert, die
    bereits wieder so gut wie obsolet ist.)

Es gibt noch weitere, weniger oft nötige Elemente, sowie zahlreiche
administrative Angaben.
In Pica3 werden die bisherigen Normdatenelemente, vor allem 8XX,
durch die GND-Nummern (mit wenigen Abweichungen) ersetzt. Erstmals
gibt es damit dann in Pica3 auch Unterfelder $x, die im Editor der
WinIBW dann rot aufleuchten. Das wichtige $9g aus GND erscheint in
Pica3 als $g; zumeist ein Ortsname als Ordnungshilfe. Das wirft die
Frage auf:


Was ist überhaupt mit Ordnungshilfen?
-------------------------------------
Hinweggefegt von der Terminologiereform! Der Term und die Spitzklammern
sind weg, aber dafür entschädigt meist ein zusätzliches Relationenfeld,
wie z.B. hier (das ist jetzt mal Pica3):

410  2\$aHistorische Commission$9g:M^ünchen
...
551 
\\$0(DE-101)004037952$0(DE-588)1006792-9$aMünchen$aMünchen$4orta$wr$iOrt

410 $9g  heißt nur schlicht "Zusatz",
551 enthält in  $0  die IdNummer des Geografikums (ja, so schreiben die
das) "München", welches hier mit seinem Relationstyp "orta" andeutet,
ein Ort zu sein.
Ändert sich also mal die Vorzugsschreibweise von München, zieht dies
keinen Änderungsbedarf an dieser und zigtausend weiteren Stellen nach
sich. Es ersprießt hier aber auch das Potential, in anderssprachigen
Systemen den Ortsnamen (oder was es sei) in der systemeigenen Sprache
aufscheinen zu lassen.

Der "Identifizierende Zusatz" erscheint zumeist in $9g ("Zusatz")
oder $n (Nummer, Zählung) oder in $x ("Allgemeine Unterteilung").
Nicht mehr in <...>! Das war ein deutscher Sonderweg, der z.B. unter
XML obskur geworden ist.

Oder, weiteres Beispiel (das ist wieder DeutschMARC):

110  2\$aHerzog-Anton-Ulrich-Museum
...
551  \\$0(DE-101)000428086$0(DE-588)42808-5$aBraunschweig$4orta$wr$iOrt

Hier hat die 551 sogar zwei Relationsnummern, der Relationstyp $4
(auch der ist wiederholbar) ist "orta" = "Ort, allgemein".
(Mehrfachangaben würden aber innerhalb $4 mittels Semikolon gereiht.)
Braunschweig wäre hier keine "Ordnungshilfe" gewesen, der Ortsbezug
ist aber programmtechnisch gleichermaßen nutzbar.


Ach ja, Indikatoren!
--------------------
MARC kennt bei jedem Feld zwei Indikatoren. Das sind i.a.R. Ziffern,
die den Feldinhalt irgendwie differenzieren. In GND sind hier nur
drei wichtige Fälle zu nennen:

1. Bei Titeln der zweite Indikator, der die Anzahl der zu uebergehenden
    Zeichen angibt. Statt dessen hätte man auch die in MARC irgendwann
    eingeführten Nichtsortierzeichen nehmen können, hat man aber nicht.

2. Bei Personennamen (Felder X00) ist der erste Indikator 0, 1 oder 2
    (persönlicher, normaler, Familienname)

3. Bei Gebietskörperschaftsnamen ist der zweite Indikator in den
    X10-Feldern eine '1', sonst '2'


Dokumentationen
---------------
Aus dem Füllhorn der Elaborate, auch unter
   https://wiki.d-nb.de/display/ILTIS/Informationsseite+zur+GND
nicht erschöpfend ausgebreitet, greifen wir nur drei Sachen raus:

Umfassende Beispielsammlung: (Word-Dateien)
   https://wiki.d-nb.de/pages/viewpage.action?pageId=53248243

Das GND-Format kennt sog. "Kernsets" für die Entitätstypen,
das sind jeweils die für den Typ verbindlichen Datenelemente.

Kernsets mit Beispielen findet man hier:
 
http://www.zeitschriftendatenbank.de/nc/aktuelles/einzelansicht/article/2012-03-01-5738/

Die GND-Implementierung des GBV in Pica3 steht hier:
 
http://www.gbv.de/bibliotheken/verbundbibliotheken/02Verbund/01Erschliessung/04Formalerschliessung/Normdaten/gnd/Formate/GBVFormat_NormKonk_offiziell_2011_1221_V01.pdf


Im 4. und letzten Teil, nächste Woche, gehen wir auf die Umwandlung
von GND-Daten in allegro-Strukturen ein und stellen dann für das
A-Format eine dafür erstellte Importparameterdatei bereit.




Mehr Informationen über die Mailingliste Allegro