[Allegro] Sprachcodes deutsch, offizielle ISO-Codeliste

Thomas Berger ThB at Gymel.com
Do Mai 21 08:48:57 CEST 2015


Lieber Herr Eversberg,

> Ja, denn die Berbersprache Tamazight fehlt, wie Sie dann ausführen,
> das ist ein Makel, zugegeben.
> Aber 485 Sprachen - da fehlen sowieso noch viele, in denen auch
> publiziert wird. Und um deren Gesamtheit muß es letztlich gehen. Die
> DNB-Liste greift in der Hinsicht zu kurz: es gibt deutlich mehr
> verschriftete Sprachen.
> 
> Ihr voluminöses, kenntnisvolles Elaborat dazu in Ehren, aber an den
> akuten Erfordernissen der Praxis geht's denn doch mehr als ein wenig
> vorbei.
> Ich versteh schon, Sie wollen alles mit XML erschlagen, weil das nun mal
> die weltweit verstandene und einzig strikt normierte
> Datenstrukturierung ist. Hat man das im Griff, steht einem die Welt
> offen, und für einen "neuen internationalen Standard" kann nur gelten:
> Das Beste oder nichts.

Nein, darum ging es mir eigentlich nicht.

[von unten hochgezogen]

> Wie wir dagegen die Sprachcode-Liste gemacht haben, will ich lieber
> nicht sagen, aber es brauchte nur eine halbe Stunde. Dafür ist sie nur
> so ungefähr richtig, s.o. Sie lag aber auch nicht als XML vor, sondern
> nur als PDF. Immerhin auch ein internationaler Standard.

Mein Interesse liegt daran, eine Viewliste aus moeglichst offiziellen
Quellen fuer ein Codesystem automatisiert zu generieren. Daher lasse
ich das per Flex durch die jeweilige allegro-Installation selbst
vornehmen, statt auf irgendeinem Server unter meiner Kontrolle eine
bereits umgewandelte Version bereitzustellen, zu der man sich bereits
morgen fragen kann, ob sie ggfls. veraltet ist. Nach sorgfaeltiger
Analyse kam heraus, dass Ihre Liste auf Stand einer Textdatei von
2009 bis auf einen Punkt damit uebereinstimmt - haetten Sie's gewusst?
Weiters kam heraus, dass die Bereitstellung der LoC fuer die Original-
ISO-639-2-Codes mangels Differenzierung in B/T fuer eine Verarbeitung
unbrauchbar ist und ansonsten mit der Bereitstellung der MARC-Sprach-
codes uebereinstimmt, das weiss vermutlich niemand, auch bei der LoC
nicht.

[Das XSLT zu programmieren brauchte wesentlich weniger als eine halbe Stunde,
vernachlaessigbar gegen den Aufwand, *die* massgebliche Quelle fuer
die Codes ausfindig machen oder zu erraten. So sollte es m.E. auch sein,
wobei man sich natuerlich fragen kann, warum es 35 Jahre nach Einfuehrung
von MAB1 mit Geocodes und 20 Jahre nach Einfuehrung des Publikums-Internets
immer noch keine Pointer von den Homepages von Regelwerken oder Daten-
formaten zu offiziellen und maschinenlesbaren Versionen der verbindlichen
Codelisten gibt. Bzw. im MARC21-Kontext fuer die US-Nutzung gibt es sie
ja, und ich habe in meiner vorigen Mail auch dargelegt, warum ich ~glaube~
dass die MARC-Sprachcodes derzeit fuer die RAK- und RDA-Anwendungen in
D-A-CH verbindlich sind]




> Nun gut, dann nehmen Sie sich mal die Dewey-Liste der dreistelligen
> Nummern vor, die gibt's in XML (deutsch und Englisch):
> 
>   http://mycore.de/classifications/sdnb.xml
> 
> (Bei DNB gibt's nur PDF, und da steht immer dran "Nicht barrierefrei")
> 
> Demonstrieren Sie mit einem XSLT-Dreizeiler, wie daraus eine ViewListe
> für uns gemacht werden kann. Damit man mal ein Exempel sieht, aus dem
> man lernen und das man bestaunen kann.

NEIN. Das sind die (neuen) Sachgruppen der Deutschen Nationalbibliographie,
die sind von der DDC ~abgeleitet~. Der MARC-Code dafuer ist "sdnb" (vgl. auch
den Namen der von Ihnen angegebenen XML-Datei) und verweist auf
http://www.dnb.de/EN/Service/DigitaleDienste/DNBBibliografie/gliederungDnb.html
(wo die Unterschiede zur echten DDC bzw. DDC-1000 erlaeutert werden).

Die Datei sagt ansonsten

<!-- based upon DINI-Zertifikat Dokumenten und Publikationsservice 2010,DINI
Schriften 3-de [Version 3.1, März 2011] -->
<!-- See also: http://www.d-nb.de/service/zd/gliederung_dnb.htm -->

und

<label xml:lang="de" text="Sachgruppen der Deutschen Nationalbibliographie"/>

d.h. da wird immerhin noch klar gesagt, was es ist, "Dewey" wie in getdewey.flx
ist also eine Verwirrung, die allein Ihnen anzulasten ist.

[Anekdote am Rande: Die BSB benutzt seit vielen Jahren fuer diverse Projekte
eine Facettenklassifikation mit Notationen (in MAB 700) wie z.B.

G:de S:eg Z:40

Ich habe Jahre gebraucht um letztendlich zu verstehen, dass es das ist, was man
in Muenchen als "DDC" bezeichnet (und warum sie nicht ganz unrecht damit haben)]

Zum "lernen und bestaunen" habe ich doch gestern etwas aufgelegt. Zu Ihrer Datei
von www.mycore.de saehe eine Loesung bis auf das veraendertes (z.B. ergaenztes)
XSLT eigentlich genauso aus, was sollte man daraus lernen koennen?

viele Gruesse
Thomas Berger



Mehr Informationen über die Mailingliste Allegro