[Allegro] DNB Testdaten
Thomas Berger
ThB at Gymel.com
Do Jun 18 10:58:04 CEST 2015
Lieber Herr Eversberg, liebe Liste,
Am 18.06.2015 um 10:16 schrieb Bernhard Eversberg:
>
> Seit gestern liegen bei DNB RDA-Testdaten in MARC21 vor:
>
>
> http://datendienst.dnb.de/cgi-bin/mabit.pl?userID=testdat&pass=testdat&cmd=login
>
> Es handelt sich um die Datei TitelTestRelease03_2015.mrc
> Man findet ebenda auch eine XML-Version derselben Daten.
>
> Hier ein Beispiel aus der ersteren Datei, umgewandelt mit MARCEDIT:
>
> =LDR 01243nam a2200301 c 4500
> =001 1200000021
> =003 DE-101
> =005 20150409140331.0
> =007 tu
> =008 150226s2002\\\\gw\|||||\||||\00||||ger\\
> =016 7\$2DE-101$a1200000021
> =020 \\$a3895002690$cHardcover$93-89500-269-0
> =035 \\$a(DE-599)DNB1200000021
> =040 \\$a1240$bger$cDE-101$d1240$erda
> =041 \\$ager
> =044 \\$cXA-DE-HE
> =110 2\$0(DE-588)44643-9$0(DE-101)000446432$aStaats- und Universitätsbibliothek
> Hamburg Carl von Ossietzky$eVerfasser$4aut
> =245 10$aKatalog der griechischen Handschriften der Staats- und
> Universitätsbibliothek Hamburg$cvon Marina Molin Pradel
> =264 \1$aWiesbaden$bDr. Ludwig Reichert Verlag$c2002
> =300 \\$a331 Seiten$bIllustrationen$c25 cm
> =336 \\$aText$btxt$2rdacontent
> =337 \\$aohne Hilfsmittel zu benutzen$bn$2rdamedia
> =338 \\$aBand$bnc$2rdacarrier
> =490 1\$aSerta Graeca$vBand 14
> =502 \\$bDissertation$cUniversität Hamburg$d2000
> =655 \7$0(DE-588)4113937-9$0(DE-101)041139372$aHochschulschrift$2gnd-content
> =700 1\$0(DE-588)123653614$0(DE-101)123653614$aMolin Pradel,
> Marina$eVerfasser$4aut
> =830 \0$aSerta Graeca$vBand 14$w(DE-101)026451034$w(DE-600)2160900-7$9ba214$7as
Hihi, da wird eine Dissertation unter der mit dem Thema zusammenhaengenden
Koerperschaft angesetzt. Selbst wenn es wegen der /Staats/-bibliothek nach
manchen in die RDA hineinragenden AACR2-Auslegungen eine "Government
publication" ist, scheint mir das sehr verwegen. Irgendjemand hat da auf
jeden Fall nicht gewusst oder aktiv ignoriert, das ein "Handschriftenkatalog"
eine wissenschaftliche Arbeit ersten Ranges ist und die Sonderregeln
fuer "Bestandskataloge von Institutionen" - sollten sie da tumb
hineindraeuen, so lange gewendet werden muessen, bis sie nicht mehr
einschlaegig sind...
> In diesem Beispiel kommen nur wenige Sonderzeichen vor.
> Der Zeichencode ist UTF-8. Die Umlaute sind codiert in der Form, dass
> das Trema hinter den Grundbuchstaben gesetzt ist. Genauso bei anderen
Umlaut != Trema
das ist (oder zumindest war) der DNB irrsinnig wichtig.
> Diakritica. Sicher hat man dafür gute Gründe (und sicher wird Berger
> die kennen).
Ich unterstelle einfach mal, dass es so ist, weil es im ISO-5426 ("MAB")-
Zeichensatz und in MARC21/ANSEL auch schon immer so war. Vielleicht
gibt es nachgeschobene Rationalisierungen, die DNB behauptet zumindest,
es handele sich um Unicode NFD < http://unicode.org/reports/tr15/ >,
also die Normalisierung gemaess kanonischer Dekomposition. Dazu muesste
aber bei mehreren Diakritika zu einem Grundbuchstaben auch eine gewisse
Reihenfolge sichergestellt sein, worauf ich mich nicht unbedingt verlassen
wuerde...
viele Gruesse
Thomas Berger
Mehr Informationen über die Mailingliste Allegro