[Allegro] Gemeinsame Normdatei: Entscheidungen stehen an

Thomas Berger ThB at Gymel.com
So Jun 12 02:13:08 CEST 2011


Liebe HANSeatInnen,

[Cc: an die allgemeine allegro-Liste, Mehrfachempfang bitte ich zu
entschuldigen: Die folgenden Ueberlegungen betreffen - bis auf einige
Erwaehnungen des Systems Kalliope der Zentraldatei der Autographen -
im Prinzip alle Anwendungen, die mit Normdaten arbeiten, insbesondere
wenn diese aus den nationalen Normdateien importiert worden sind. Im
folgenden kann "HANS" stets gefahrlos durch "$A.CFG", "$M.CFG" etc.
ersetzt werden, die Argumente und auch die Zustandsbeschreibungen
bleiben dabei im wesentlichen gueltig]

Die Einfuehrung der Gemeinsamen Normdaten GND besteht in der Umstellung
auf MARC Authority als Austauschformat fuer Normdaten, anders als die
drei MAB-Dialekte fuer Personen (inklusive Familien), Koerperschaften
(darunter auch als Koerperschaften angesetzte Veranstaltungen) und
Schlagworte (mit "Hinweissaetzen") gibt es nur ein MARC-Format fuer
Personen, Familien, Koerperschaften, Veranstaltungen, Einheitstitel,
Schlagworte etc:

  "Headings may be names, name/title combinations, uniform titles,
  chronological terms, topical terms, genre/form terms, subdivisions,
  extended subject headings, or node labels."
                  < http://www.loc.gov/marc/authority/adintro.html >

Auf technischer Ebene sollte man diese Unterschiede nicht ueberbewerten,
die funktionalen Anforderungen an Personen- und Koerperschaftssaetze
sind aehnlich, die an Schlagwortsaetze eher abweichend, das ist
unabhaengig vom Format zu beruecksichtigen. Und irgendwo recht
prominent (in MAB durch Angabe des Dialekts im Header, in MARC durch
Nutzung einer der einander ausschliessenden Hauptansetzungsfelder)
muss ein Datensatz aussagen, was er ist (bzw. - "Headings" - nach
MARC-Verstaendnis aussagen, was er ansetzt: Die Zweckbestimmung,
Zeichenketten in echte bibliographische Anwendungen zu transportieren
schwingt staerker mit als wir - hierzulande - inzwischen gewohnt sind).

[Die Vorstellung, dass es sich um mehrere naturgegeben trennbare
Untermengen von Datensaetzen in der ILTIS-Datenbank der DNB handelt,
wird zudem aufgehoben, es bleibt eine grosse Menge Normdaten
verschiedenster Arten: Die gemeinsame (fuer Formal- und Sacherschliessung)
Normdatei]

Nur ein Format zu haben hat deutliche Vorteile, Datenfelder gleichen
Inhalts haben zwingend dieselbe Nummer und Felder mit gleicher
Nummer haben dieselbe Bedeutung. Und benoetigte Informationen zu
einer Koerperschaft, die auch fuer Sacherschliessung genutzt wird,
muessen nicht auf zwei komplementaere Datensaetze in unterschiedlichen
Formaten verteilt werden, weil das eine Format alles benoetigte
transportieren kann. Fuer Personen war das bereits in der MAB-Welt
geregelt worden (MAB-Personen konnte alles fuer RSWK-Anwendungen
benoetigte transportieren, schlimmstenfalls durch Transport von
RAK- und paralleler RSWK-Ansetzung, dementsprechend sind die
"Personen der Sacherschliessung" normale PND-Personen mit zusaetzlich
vermerkter SWD-Autorisierung und einer weiteren Identnummer), fuer
Koerperschaften ist es in HANS so, dass Sacherschliessung sich nach
den Koerperschaftsansetzungen der GKD orientiert und nicht nach
RSWK/SWD.

Nur ein Format zu haben ermoeglicht erst das Zusammenlegen der
traditionell getrennten Normdateien PND, GKD und SWD (und DMA-EST),
im Laufe der Jahre war das wegen uebergreifender Verknuepfungen und
zur Vermeidung von Doppelarbeit immer mehr zum Desiderat geworden.
Die Vereinheitlichung von Ansetzungen zwischen den bedienten
Regelwerken (RAK, RSWK, RNA, ...) ist dabei nicht zwingend (aber
der Faktor mit dem groessten Einzeleinfluss auf Arbeitsersparnis),
absolut wichtig sind allerdings einheitliche "Entitaetenregeln",
d.h. was nach RAK wg. Ansetzungsaenderung zwei verschiedene Koerper-
schaften sind darf nach RSWK nicht drei oder eine Koerperschaft
sein. Speziell MARC Authority betreffend benoetigt man auch eine
Kennzeichnung der bzw. Harmonisierung mit den vom Format vorgesehenen
Entitaetstypen, insofern werden einerseits Veranstaltungen zu einem
eigenen Typ und sind keine Koerperschaften mehr und andererseits wird
die fundamentale (RSWK-)Unterscheidung zwischen ortsgebundenen (c) und
nicht ortsgebundenen (k) Koerperschaften aufgegeben (wohlgemerkt: das
alles auf der Ebene des Formats, ein Kongress kann weiterhin nach RAK
(alternativ) angesetzt werden und beteiligte Koerperschaft einer Publikation
sein, nur folgt die Normdatei nicht mehr dem Paradigma, dass ein "Meeting"
ein Sonderfall eines "Corporate Body" sei). Zur Vorbereitung sind in
den letzten Jahren groesstenteils automatisch in PND, GKD und SWD
"Entitaetscodes" eingetragen worden, die bei der Umstellung auf
MARC Authority wirksam werden und die Beschickung des Formats anhand
der dafuer gueltigen Paradigmen steuern.

Schon immer waren die Nummernkreise von PND, SWD und GKD so gewaehlt,
dass es keine Ueberschneidungen gibt, daher lassen sich ja bereits
jetzt alle einheitlich ueber das Schema http://d-nb.info/gnd/<Nummer>
identifizieren (und sogar adressieren). Bezueglicher der Nummern wird
die Ueberfuehrung in die "gemeinsame" Normdatei also keinen Bruch
bedeuten, bzw. nur insofern, dass zukuenftige, bereits in der GND
generierte Saetze, Nummern tragen werden, die nicht das Schema von
GKD oder SWD fortfuehren, auch wenn es sich ~eigentlich~ um
Schlagworte etc. handelt.



Auf dem HANS-Anwendertreffen in Zwickau hatte ich nun folgende Fakten
zur GND-Einfuehrung vorgetragen:

* Strukturell (oder besser: funktional?) bleibt insbesondere fuer die
  PND fast alles beim alten, d.h. es werden zwar nicht die MAB-Formate
  generell nach MARC umgesetzt, wohl aber werden die Datensaetze aus
  den bisherigen Normdateien weitgehend verlustlos im neuen Format
  transportiert werden (es gibt ja eigentlich nichts ueberfluessiges
  in den Normdateien, eher ein zu Weniges, Beschluesse zu Regelwerks-
  umstellungen sind noch nicht gefallen, das Resultat von Millionen von
  Arbeitsstunden setzt man nicht leichtfertig aufs Spiel...)

* Weil es keine allgemeine Formatumsetzung ist, sondern eine Neuverpackung
  konkreter Normdateien (plus leichte Veraenderung der Entitaeten), wird
  es niemals MAB-Import- oder -Exportschnittstellen fuer die GND geben

* Die Einfuehrung wird konzertiert erfolgen (das betrifft DNB und
  Regionalverbuende, m.W. auch Kalliope als Teilnehmerin an der Online-
  Normschnittstelle. Fuer den Rest der Welt wird naturgemaess nichts
  mitgeregelt)

* "Die Nummern bleiben gleich"

* Verweisungsformen sind in MARC21 tendenziell aufgeblaeht (mir ist nicht
  klar, ob das wirklich MARC21 ist oder AACR2-Praxis, jedenfalls ist es
  Usus) und ich konnte mir nicht vorstellen, dass man Menschen diese
  Form der Erfassung zumuten mag (es geht um das flaechendeckend verteilte
  Unterfeld $d, das den Inhalt von 549 $a repliziert):

100 0 ▼aNapoléon▼cFrance, Empereur, I.▼d1769-1821
400 0 ▼aNapoléon▼cFrankreich, Kaiser, I.▼d1769-1821
400 0 ▼aNapoleon▼cFrance, Empereur, I.▼d1769-1821
400 0 ▼aNapoléon▼cI. Kaiser der Franzosen▼d1769-1821
400 1 ▼aBuonaparte, Napoléon▼d1769-1821
...
549   ▼wi▼iLebensdaten▼a1769-1821
...
700 07▼aNapoleon▼cFrankreich, Kaiser, I.▼2rswk▼d1769-1821
700 17▼aNapoleon,▼0(DLC)n 790549332naf▼bI, ▼cEmperor of the French,
▼d1769-1821

  Insofern erwartete ich, dass insbesondere die Aleph-Verbuende versuchen
  wuerden, die MARC-formatierten GND-Saetze in ihre herkoemmlichen MAB-
  aehnlichen Strukturen zurueckzutransformieren.

Meine Schlussfolgerungen aus diesen Fakten waren allerdings ziemlich daneben,
wie ich auf dem Bibliothekartag in Berlin gelernt habe:

"Die Nummern bleiben gleich" bezog sich stets nur auf die Identnummern,
die Feldnummern in ILTIS werden umgestellt auf die MARC-Feldnummern (zumindest
auf der Ebene PICA3, die interne Umstellung auf der PICA+-Ebene ist
moeglicherweise weniger drastisch), die Anwendungsbeschreibungen und
Redaktionsanleitungen werden neu erstellt und die Normdaten-Anwender
ca. zwei Monate vor der Umstellung darin geschult.

Die Aleph-Verbuende (HBZ, BVB, OeBV) haben bei ihrem Systemhersteller eine
Aenderung in Auftrag gegeben, in ihren MAB-basierten Systemen (eigentlich
ja: MARC-Systeme mit MAB-Feldnummern) die GND mit den neuen MARC-Feldnummern
zu implementieren.

Allerdings wird subtil unterschieden zwischen dem "GND-MARC-Austauschformat"
das aussieht wie oben, und dem Internformat in ILTIS, das eben nicht das
redundante Unterfeld $d ueberall kennt und auch sonst einige "Vereinfachungen"
einfuehrt, z.B. wird ein Feld mit sehr vielen Einzelcodes
079   ▼ap▼qs▼qf▼qa▼qz▼t12▼t7▼t384▼uv▼uw▼uk▼um▼vpik
dann doch eher positional beschickt, wie es der bisherigen Praxis entpricht
079  p sfaz ...  (die genaue Syntax liegt mir nicht vor, es gibt wohl
      Dokumente auf dem Normdaten-Wiki der DNB, ich versuche da
      heranzukommen)
Auf eben dieses MARC-aehnliche Internformat werden sich die Anwendungs-
beschreibungen beziehen und (nach Aussage der DNB) ist auch das durch
die Aleph-Verbuende implementierte Internformat weitgehend mit dem ILTIS-
Internformat identisch (man will ja die Redaktionsanleitungen und
Feldbeschreibungen nicht staendig auf das eigene System adaptieren
und Bedienung des "echten" MARC mit seinen Redundanzen etc. ist auch
verbeamtetem Personal nicht zumutbar).

Weitere Informationen "am Rande": Die Umstellung wird jetzt ziemlich sicher
im 1. Quartal 2012 stattfinden, die DNB praeferiert das Osterwochenende,
um die Auswirkungen des auf 3-5 Tage geplanten Einfrierens aller Normdaten
moeglichst gering zu halten. Alle Schnittstellen und Produkte sind betroffen,
also z.B. die Normdaten-DVD (wird eingestellt), der Datenshop (kein MAB mehr
fuer Normdaten), die Downloads ueber die WinIBW ("dow mrc" statt "dow mab")
und natuerlich auch die strengeren Distributionswege OAI/ONS, Wochen-
lieferungen und SRU. Und auf der inhaltlichen Ebene: Die Zusammen-
fuehrung der Ex-GKD-Koerperschaften mit ihren Ex-SWD-Pendants wird
im laufenden Betrieb nach (und nicht wie urspruenglich geplant:
anlaesslich) der datentechnischen Umstellung erfolgen.

Im Gespraech habe ich darum gebeten, auf zeitnahes Funktionieren der
Download-Funktionalitaet aus der WinIBW zu achten und dass die Umsetzungs-
regeln zwischen Internformat und GND-MARC-Austauschformat zu ver-
oeffentlichen sind: Denn (vermutlich) jedes System moechte beim Import von
PND-Daten die Redundanzen aus dem Externformat entfernen oder unterdruecken,
denn sonst sieht es in diesem System ploetzlich so aus, als sei auf AACR2
umgestellt worden, um Lebensdaten qualifizierte Verweise kennen wir ja
in der Form nun wirklich nicht...

In Zwickau hatte ich unter der Annahme, dass sich die ILTIS-Felder
der eigentlichen PND als Anwendung anlaesslich des Uebergangs zur GND
nicht sonderlich aendern, die Empfehlung ausgesprochen, auch in HANS
an den Feldern der Normdaten nichts zu aendern. Das moechte ich nun
zur Disposition stellen:

Ist-Zustand in HANS ist eine Gestaltung der Datenfelder fuer Normdaten,
die aelter als die Spezifikation von MAB-PND ist und es gibt auch
bezueglich der Teilmenge von Feldern, die fuer die Anwendung PND
relevant sind, gewisse Reibungsverluste: Beispielsweise sind die
Lebensdaten in HANS auf "von" bzw. "bis" aufgeteilt mit Kennzeichnungs-
moeglichkeit fuer die jeweilige Ungefaehrheit, in MAB-PND hingegen sind
es zusammenfassende Felder, aber fuer normierte, exakte und ungefaehre
Angaben jeweils andere, alle sind jedoch annotierbar. In manchen Faellen
"konnte" das HANS-Datenformat mehr (Zeittafeln etwa) und das MAB-Format
hat im Laufe der Zeit gleichgezogen, in anderen Faellen hat sich das
MAB-Format leicht fortentwickelt oder die PND hat mehr Felder genutzt,
in HANS wurde das je nach Bedarf nachvollzogen: Absolute Kompatibilitaet,
wie sie etwa die Verbundsysteme wegen der Online-Normschnittstelle (also
Eingabe in ihrem System unmittelbar gefolgt von automatischer Einspeisung
in ILTIS) benoetigen, war und ist in HANS kein Thema, ein gewisses Mehr
in HANS ist uns sogar ganz lieb (etwa Freitextbeschreibung der persoenlichen
Beziehungen, die dennoch verknuepft sind: So etwas kann von den biblio-
thekarischen Systemen nur allegro und dementsprechend ist auch kein
Austauschformat darauf eingestellt).

Die bisherige ILTIS-Anwendung kannte einen sehr grossen Unterschied
zwischen der internen Darstellung in PICA3-Feldern (auf die sich
die Anwendungsbeschreibung und Redaktionsanleitung bezogen) und dem
Austauschformat MAB-Personen. Schnittstellen haben wir stets nur fuer
den offiziellen Austauschstandard MAB realisiert, eine PICA-Schnittstelle
hatten wir ab und zu diskutiert, damit waeren wir aber die MAB-
Schnittstellen nicht losgeworden und haetten zudem der Dokumentation
hinterherjagen muessen (es handelt sich ja um "interne" Dokumentation
fuer die Teilnehmer an den jeweiligen Normdateien, fuer die PND findet
sie sich seit einigen Jahren auf den Webseiten der DNB, fuer die SWD
ist das seit ebensovielen Jahren - angekuendigt). Die PND als (ILTIS-)
Anwendung hat sich in den letzten Jahren den Anforderungen entsprechend
fortentwickelt, das wurde dann irgendwie in MAB umgesetzt, anfangs durch
sparsames Fortschreiben der MAB-Dokumentation, seit dem "Einfrieren"
im Jahr 2006 dann durch massives Ausweichen auf MAB-Felder im "privaten"
Bereich: Nach dieser langen Zeit wirkt das Format streckenweise eher
gebastelt als designt und zusaetzlich gab es einen formatbedingten
Reformstau.

Im GND-Kontext sieht das erst einmal analog aus: Es gibt ein ILTIS-
Internformat (auf das sich die Redaktionsanleitungen beziehen werden)
und ein MARC-Austauschformat (das dokumentiert ist), Schnittstellen
benoetigen alle (und auch HANS) fuer letzteres.

Das Austauschformat ist allerdings im Hinblick auf die Anforderungen
der existierenden Normdaten spezifiziert worden (etwa am Beispiel
der Personen: Individualisierung jenseits der Ansetzung und Verknuepfungen
sind den bislang in MARC Authorities transportierten Normdaten
voellig fremd gewesen): die "deutsche" Community hat auf das MARC-
Format einfluss genommen bzw. dort, wo dies nicht gelang, in "privaten"
MARC-Feldern verbindliche Vorgaben als "nationale Schicht" getroffen.
Das interne Format lehnt sich nun weitestgehend an das Austauschformat
an, mit den als notwendig empfundenen Kompromissen bei Redundanz und
anderem Eingabekomfort. Und ein (fast?) identisches Internformat scheint
nun auch in den Nicht-PICA-Systemen der Aleph-Verbuende implementiert zu
werden.

Man koennte dieses Internformat also als De-facto-Standard betrachten,
seine Vorteile bestehen darin, dass Redaktionsanleitungen nachnutzbar
sind und wegen seiner Naehe zum Austauschformat duerfte die Konversion
zu und von MARC Authorities recht einfach realisierbar sein und auf
jeden Fall ohne irgendwelche Verluste (wenn es um Daten geht, die
gemaess den PND-Anwendungsregeln zustandegekommen sind).

Abweichend von meinem Zwickauer Votum stellt sich damit nun ernsthaft
die Frage, ob wir in HANS nicht ebenfalls dieses offizioese GND-Internformat
implementieren sollten. [Konzeptionell faende ich das recht spannend: Wir
loesen uns vom eigenen HANS-Datenformat "aus einer Hand" und fuehren etwas
hybrides ein, indem wir uns immer dort, wo uns eine Anwendung ueberzeugt
bzw. als unbedingt massgeblich erscheint, moeglichst weitgehend anlehnen
bzw. bedienen]

Im Detail stelle ich mir das so vor:

- Es wird gewisse Abweichungen geben: HANS-#003 und #005 sind z.B. Felder,
  die in HANS universell sind und in MARC-Authorities ebenfalls vorkommen,
  bei solchen Konflikten wuerde man die HANS-Felder erhalten und die
  MARC-Felder auf etwas eindeutiges (mit Buchstaben an einer Stelle)
  abbiegen (oder allegro's Moeglichkeiten hierarchischer Untersaetze
  nutzen, um in einem Satz eine #005 im HANS-Sinn und eine andere #005
  mit MARC-Semantik unterzubringen).

- Die alten Strukturen fuer Personen und Koerperschaften mit HANS #800 etc.
  werden nicht abgeschafft, sondern bleiben parallel bestehen.
  MAB-Importe und -Exporte sind mit Saetzen nach altem Muster weiterhin
  moeglich, MARC-Importe bilden Saetze nach neuem Muster, fuer diese sind
  auch MARC-Exporte ohne weiteres moeglich. Saetze nach neuem Muster
  waeren allerdings die bevorzugten bei Neueingaben.
  Die Parameterdateien fuer Indexierung und Anzeige sind so zu erweitern,
  dass Normdaten nach altem und nach neuem Muster moeglichst identische
  Ergebnisse liefern.

- Wegen der Kontinuitaet der Identnummern sollte ein Reimport eines
  (ehemaligen) PND-Satzes aus der GND die alte durch die neue Repraesentation
  ersetzen (Schwierigkeit bereits bei MAB: Lokale Abweichungen in #801
  bzw. #831ff und anderes). Dieser Reimport waere der bevorzugte
  Migrationsweg fuer die Saetze, die in den HANS-Systemen bereits mit
  PND-Nummern ausgestattet sind. [M.W. werden auch die Verbuende so
  vorgehen: Alte Normdateien abklemmen und von der DNB bereitgestellte
  Grundlieferungen im GND-MARC-Austauschformat integrieren]

- Fuer Saetze nach altem Muster koennte ein a) vereinfachter MARC-Export
  (b) also wirklich nur Export, nicht Import) realisiert werden: Wichtig
  waere das vor allem fuer selbstangelegte nicht-PND/GKD-Saetze, die (so
  behaupte ich) etwas einfacher gestrickt sind als das typische Importat
  aus einer Normdatei.

- Alternativ oder zusaetzlich koennte auch eine "Globale Manipulation"
  programmiert werden, die Saetze nach altem Muster in solche nach neuem
  umsetzt: Hier sehe ich allerdings moegliche Datenverluste (der Art, wie sie
  sonst erst beim Weg ueber die standardisierten Schnittstellen erfolgen):
  Die oben bereits als Beispiel genannten verbal ausformulierten persoenlichen
  Beziehungen mit Verknuepfungen in HANS-#816 gehen ueber die Gepflogenheiten
  der PND und die Moeglichkeiten von MAB-814m/815m hinaus, a priori wissen wir
  aber nicht, ob die dafuer stehenden Felder in MARC-Authority bzw. deren
  Abwandlung im GND-Internformat einen analogen Ueberschreitungsspielraum
  erlauben.

- Apropos Ueberschreitungsspielraum: HANS hat weder 1994 noch 2011 erzwungen,
  die PND-Regeln von 1995 oder 2011 einzuhalten. Anwender haben das genutzt,
  um reichhaltiger oder schlampigere oder schlicht nach abweichenden Regeln
  (etwa aus Altbestandskonversion) gestrickte Saetze zu erstellen. Sie folgten
  damit ihren eigenen Beduerfnissen oder Moeglichkeiten, zu denen (behaupte ich)
  normalerweise nicht gehoerte, die Akzeptierbarkeit solcher Saetze durch die
  PND oder die generelle Transportierbarkeit in MAB-Personen zu beurteilen.
  Ich vermute, dass die 1:1-Uebernahme eines offizioesen Internformats diese
  Freiheiten etwas einschraenken wird (die Einhaltung der zugehoerigen
  Redaktionsanleitung kann aber nicht erzwungen werden, insofern wird es
  weiterhin moeglich sein, fuer die PND inakzeptable Saetze zu produzieren,
  die "Freitext mit Verknuepfungen" enthalten, wo normierte Inhalte erwartet
  werden). Diejenigen, die absichtlich gegen PND-Regeln gearbeitet haben,
  werden solche Einschraenkungen evtl. kritisch sehen, diejenigen, die
  moeglicherweise nur unwissentlich gegen die Regeln verstossen haben, werden
  hingegen solche Einschraenkungen eher begruessen...

Im Hinblick auf Kalliope gibt es einige Unwaegbarkeiten: Dieses System ist
ploetzlich dem Spagat ausgesetzt, einerseits wegen ONS zum Stichtag seine
(bidirektionale) Kommunikation mit den Normdateien auf MARC Authority
umzustellen. Andererseits ist es selbst im Begriff, sich von bibliothekarischen
Paradigmen zu loesen und archivarischen anzunaehern, und (m.W. auch
intern) im Bereich der Normdaten EAC einzusetzen: Das muss damit schon
zwingend ein intern so erweitertes EAC sein, dass es keine Reibungsverluste
bei der Konversion zu und von GND-MARC-Austauschformat (als Subset bei
gleichzeitiger Erweiterung von MARC Authority) gibt. Drittens aber kennen
wir keine Aussagen seitens Kalliope, ob und wann (und wie ploetzlich) MAB
als Austauschstandard nicht mehr unterstuetzt werden wird.

Bei der von mir oben skizzierten Einfuehrung des GND-Internformats in HANS
sehe ich ernsthafte Probleme nur in den Faellen, wo dieses von oder nach
MAB abzubilden waere, also von irgendwoher MAB-Lieferungen von Saetzen
erhalten, die eigentlich in der GND sind und daher intern besser auf die
neue Art zu repraesentieren waeren; oder dass aus der GND bezogene
Saetze als MAB zu exportieren sind. Es muss ausgeschlossen werden (koennen),
dass solche Anforderungen entstehen.

Die Anforderung, existierende HANS-Normsaetze (insbesondere solche, die
sich nicht automatisiert aus der GND reimportieren lassen) formattechnisch
umzusetzen, sei es durch interne Umwandlung in das GND-Internformat oder
durch (vereinfachten) Export ins GND-MARC-Austauschformat laesst sich
ebenfalls nicht leugnen, hier waeren wir aber nicht an einen festen
Stichtag gebunden (gemacht wird es, wenn man mit niemandem mehr MAB
sprechen wird oder alle Saetze als MARC exportieren moechte) und auch
technisch scheint es mir ueberschaubarer als die "ernsthaften Probleme"
des vorigen Absatzes.


Zum Vergleich eine Abschaetzung dessen was passieren muss, wenn wir
das HANS-Internformat fuer Normsaetze moeglichst unveraendert lassen:

Die zu schaffenden Im- und Exportschnittstellen fuer das GND-MARC-
Austauschformat waeren deutlich aufwendiger, da sie ja echte Umsetzungs-
arbeit leisten muessten und nicht nur auf das abgeleitete GND-
Internformat vermitteln.

Auswirkungen (auch massive) auf das HANS-Internformat sind nicht aus-
zuschliessen: Waehrend MAB (und HANS analog) Bedeutungen gerne mit
Feldnummern bzw. Indikatoren fixieren ("ist es 814m, dann handelt es
sich bei der Identnummer um eine der PND", "ist es 820k, dann handelt
es sich um die LoC-Ansetzung"), so operiert MARC21 fast durchgehend
mit universellen Unterfeldern, d.h. der Inhalt von etwa $2 ist ein
Code der besagt, aus welchem terminologischen oder sonstigen Kontext
der "eigentliche" Feldinhalt im Unterfeld $a stammt. Und saemtliche
Identnummern sind mit ISIL bzw. MARC-Organisationscode in einer
speziellen Syntax gepraefixt. Dieser Mechanismus ist deutlich flexibler
als die Herangehensweise von HANS, und auch wenn wir durch die
Einschraenkung "nur GND" uns oft auf die Umsetzung der Datenfelder mit
"bekannten" Codes beschraenken koennen, ist momentan nicht auszuschliessen,
dass wir fallweise auch in HANS die flexibleren Mechanismen einfuehren
muessen (behaupte ich: eine genauere Analyse steht noch aus).
Solche Auswirkungen aufs Datenformat bedeuten Aenderungsbedarf bei
diversen Parameterdateien (Indexierung, Anzeige, Exporte). Speziell
muessten auch die MAB-Im- und Exportparameterdateien angepasst und
neu getestet werden, sofern bis dahin nicht absolut klar ist, dass
man die niemals mehr benoetigen wird.


Momentan haben wir sicherlich noch nicht alle benoetigten Informationen
beisammen, um uns fuer eine der beiden fundamentalen Moeglichkeiten
"HANS-Internformat fuer Normdaten beibehalten" vs. "GND-Internformat
uebernehmen" entscheiden zu koennen.

- Wir vertrauen auf die Nuetzlichkeit und Handhabbarkeit des GND-
  Intenformats, weil hunderte von Normdaten-Bearbeitern ab dem
  Stichtag damit arbeiten werden, eigene Kenntnisnahme als
  Entscheidungsgrundlage waere aber gewiss vorteilhaft

- [Weil "unsere" Internformate gewachsene sind und auch kein
  Musterbeispiel fuer gutes Design und angemessene Reaktion
  auf geanderte Anforderungen der letzten 15 Jahre hat die
  Uebernahme eines frischen Formats inklusive fertiger Anwendungs-
  beschreibung und Redaktionsanleitungen gewiss ihren Reiz]

- Das GND-MARC-Austauschformat ist weitgehend fertig spezifiziert
  (< http://www.d-nb.de/service/zd/rundschr_datendienst.htm#gnd >),
  insofern kann nun mit der Abschaetzung begonnen werden, inwieweit
  ein halbwegs ernsthafter Im- und Export von GND-Daten zwingend
  Aenderungen an den bestehenden Internformaten fuer Normdaten
  erfordert. Und welche Auswirkungen diese Aenderungen auf weitere
  Parameterdateien haetten.

- Umgekehrt kann man mit dem Austauschformat als Naeherung fuer
  das GND-ILTIS-Internformat untersuchen, wie aufwendig die
  Erweiterungen von Indexierung und Anzeige waeren, damit Saetze
  in diesem Format Ergebnisse analog den bisherigen Saetzen
  liefern.

- Ein Export ~einfacher~ selbstangelegter Saetze nach GND-MARC-
  Austauschformat wird bei beiden Alternativen benoetigt, die
  oben angesprochene "Globale Manipulation" zur internen Umsetzung
  zwischen altem und neuen Internformat saehe nicht viel anders
  aus.

- Fuer den Reimport frueher importierter Normsaetze im Format
  GND-MARC duerften sich eigentlich recht universelle Werkzeuge
  entwickeln lassen (ich denke da an die SRU-Schnittstelle der
  DNB, die nach Registrierung fuer Normdaten kostenlos nutzbar
  ist). [Reimport war latent schon immer Thema, da gerade Norm-
  daten zu Personen staendig individualisiert, umgelenkt,
  zusammengefuehrt oder sonstwie verbessert werden]

- Die GND-Einfuehrung betrifft das Verhaeltnis zwischen DNB und
  Regionalverbuenden sowie das Schnittstellenverhalten der DNB.
  Die Umstellung erfolgt in diesen Systemen wie erwaehnt konzertiert
  ohne jegliche Uebergangsfrist (das wird also ganz anders sein als
  bei der allgemeinen MARC21-Einfuehrung fuer Titeldaten, wo sehr
  lange Uebergangsfristen gelten). Dem Vernehmen nach werden einige
  Verbuende die GND-Daten dann nach MAB(?) umsetzen, um ihre Lokalsysteme
  weiterhin mit Normdaten in bekannter Manier zu versorgen. Insgesamt
  ist mir aber voellig unklar, inwieweit MAB fuer Normdaten fuer alle
  Systeme, die bislang Schnittstellen von oder zu PND, GKD und SWD
  unterhielten, schlagartig irrelevant werden wird, oder ob man
  selbst fuer eine gewisse Zeit noch auf die Funktionstuechtigkeit der
  eigenen MAB-Schnittstellen achten sollte (siehe die Spekulationen
  zu "offiziellen" Lieferschnittstellen von Kalliope oben).

viele Gruesse
Thomas Berger



Mehr Informationen über die Mailingliste Allegro