[Allegro] DNB Testdaten

Thomas Berger ThB at Gymel.com
Do Jun 18 10:58:04 CEST 2015


Lieber Herr Eversberg, liebe Liste,

Am 18.06.2015 um 10:16 schrieb Bernhard Eversberg:
> 
> Seit gestern liegen bei DNB RDA-Testdaten in MARC21 vor:
> 
> 
> http://datendienst.dnb.de/cgi-bin/mabit.pl?userID=testdat&pass=testdat&cmd=login
> 
> Es handelt sich um die Datei  TitelTestRelease03_2015.mrc
> Man findet ebenda auch eine XML-Version derselben Daten.
> 
> Hier ein Beispiel aus der ersteren Datei, umgewandelt mit  MARCEDIT:
> 
> =LDR  01243nam a2200301 c 4500
> =001  1200000021
> =003  DE-101
> =005  20150409140331.0
> =007  tu
> =008  150226s2002\\\\gw\|||||\||||\00||||ger\\
> =016  7\$2DE-101$a1200000021
> =020  \\$a3895002690$cHardcover$93-89500-269-0
> =035  \\$a(DE-599)DNB1200000021
> =040  \\$a1240$bger$cDE-101$d1240$erda
> =041  \\$ager
> =044  \\$cXA-DE-HE
> =110  2\$0(DE-588)44643-9$0(DE-101)000446432$aStaats- und Universitätsbibliothek
> Hamburg Carl von Ossietzky$eVerfasser$4aut
> =245  10$aKatalog der griechischen Handschriften der Staats- und
> Universitätsbibliothek Hamburg$cvon Marina Molin Pradel
> =264  \1$aWiesbaden$bDr. Ludwig Reichert Verlag$c2002
> =300  \\$a331 Seiten$bIllustrationen$c25 cm
> =336  \\$aText$btxt$2rdacontent
> =337  \\$aohne Hilfsmittel zu benutzen$bn$2rdamedia
> =338  \\$aBand$bnc$2rdacarrier
> =490  1\$aSerta Graeca$vBand 14
> =502  \\$bDissertation$cUniversität Hamburg$d2000
> =655 \7$0(DE-588)4113937-9$0(DE-101)041139372$aHochschulschrift$2gnd-content
> =700  1\$0(DE-588)123653614$0(DE-101)123653614$aMolin Pradel,
> Marina$eVerfasser$4aut
> =830  \0$aSerta Graeca$vBand 14$w(DE-101)026451034$w(DE-600)2160900-7$9ba214$7as

Hihi, da wird eine Dissertation unter der mit dem Thema zusammenhaengenden
Koerperschaft angesetzt. Selbst wenn es wegen der /Staats/-bibliothek nach
manchen in die RDA hineinragenden AACR2-Auslegungen eine "Government
publication" ist, scheint mir das sehr verwegen. Irgendjemand hat da auf
jeden Fall nicht gewusst oder aktiv ignoriert, das ein "Handschriftenkatalog"
eine wissenschaftliche Arbeit ersten Ranges ist und die Sonderregeln
fuer "Bestandskataloge von Institutionen" - sollten sie da tumb
hineindraeuen, so lange gewendet werden muessen, bis sie nicht mehr
einschlaegig sind...



> In diesem Beispiel kommen nur wenige Sonderzeichen vor.
> Der Zeichencode ist UTF-8. Die Umlaute sind codiert in der Form, dass
> das Trema hinter den Grundbuchstaben gesetzt ist. Genauso bei anderen

Umlaut != Trema

das ist (oder zumindest war) der DNB irrsinnig wichtig.


> Diakritica. Sicher hat man dafür gute Gründe (und sicher wird Berger
> die kennen).

Ich unterstelle einfach mal, dass es so ist, weil es im ISO-5426 ("MAB")-
Zeichensatz und in MARC21/ANSEL auch schon immer so war. Vielleicht
gibt es nachgeschobene Rationalisierungen, die DNB behauptet zumindest,
es handele sich um Unicode NFD < http://unicode.org/reports/tr15/ >,
also die Normalisierung gemaess kanonischer Dekomposition. Dazu muesste
aber bei mehreren Diakritika zu einem Grundbuchstaben auch eine gewisse
Reihenfolge sichergestellt sein, worauf ich mich nicht unbedingt verlassen
wuerde...

viele Gruesse
Thomas Berger



Mehr Informationen über die Mailingliste Allegro