[Allegro] Mal wieder was zu GND

Thomas Berger ThB at gymel.com
Fr Okt 12 16:09:28 CEST 2012


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg, liebe Liste,

>> Die 550 bedeutet "Sachbegriff - Beziehung". Nur gibt es
>> vielerlei Beziehungen. In diesem Fall 2, gekennzeichnet im $4 mit
>> "obal" bzw. "vbal", und das heißt "Oberbegriff allgemein" bzw. 
>> "Verwandter Begriff". Es gibt noch viel mehr solche GND-Codes. 
>> Das Problem beim Import ist: Wenn man gezielt die Oberbegriffe 
>> haben will - wie macht man das?
>> 
> 
> Wegen anderer Anforderungen mußte ich das erst mal unterbrechen. 
> Inzwischen hat ein Gedanke sich erhoben, der jedem einschlägig 
> indoktrienierten Programmierer auf der Hand liegt: Eine Auswertung 
> regulärer Ausdrücke muß her. Damit griffe man die Zeilen raus, in
> denen vorn 500 steht und weiter hinten $4obal etc. Und eine 
> Schleife könnte diese dann verarbeiten.
> 
> Ja. Nur ist erstens die Importlogik eine sehr verzwickte, die nicht
> stets und ausschließlich mit zeilenweise strukturiertem Material
> umgehen zu können braucht, und zweitens ist das mit dem 
> schleifenförmig verarbeiten und die jeweilige Zeile auch noch 
> umstrukturieren immer noch ein Problem. Also m.a.W., das 
> Integrieren einer vollständigen regulären Ausdrucksmechanik scheint
> mir utopisch. Eine recht einfache Teillösung, die für den in Rede
> stehenden Fall reicht, könnte in einer schlichten Erweiterung der
> Syntax der s-Befehle bestehen:

Fuer meine GND-Importe hatte ich eher Probleme bei einer
anderen, eher unerwarteten Stelle:

Die Importparameterdatei sollte moeglichst sowohl fuer
ISO2709-Daten mit Directory als auch fuer allgemein
gefelderte ("Typ C" [?]), wie man sie durch triviale Umwandlung
von MARCXML erlangen kann, funktionieren, d.h. die notwendigen
Unterschiede sind die Art der Positionierung, in mehr sollten
sich Parameterdateien jedoch nicht unterscheiden.

Ich wollte dann mit m-Befehlen moeglichst treffendes einsammeln,
das hat dann aber nicht funktioniert, weil die D-Befehle
fuer das ISO-Format das entsprechende Feld stets entwertet
haben, egal ob ich es wollte oder nicht.

Uebrig blieben zwei funktionierende Loesungen, naemlich
a) alles inklusive Unterfeldern in eine wiederholbare
Park-Kategorie einzusammeln und im nachgelagerten Export
per Unterprogramm auszuwerten
b) in den Importparametern sehr explizite Schleifen
konstruktionen aufzubauen, die nicht auf die Entwertung
von Feldern mittels "m" oder "x" setzen, sondern nach
j 0 jeweils die verfuegbaren "vorwaerts"-Positionierungen
der Importsprache ausnutzten.

viele Gruesse
Thomas Berger


-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.12 (Cygwin)
Comment: Using GnuPG with Mozilla - http://www.enigmail.net/

iJwEAQECAAYFAlB4JJgACgkQYhMlmJ6W47NFdgP/S2sm99nCwOCHBpFBsgxxJbu/
0DLQYhGeFzT9FoL5H+lCnfZbJiBMv7+/CYxQhGFSwZ6acWhmbD0S/EB5rri/53g0
5EZjaJOAVH1CglU4Tv0YRM6B1fADxDqk7eTvXnVTA0Et8jpSZvTRp9oGnN6GAoUu
gJe9jPoETJ/8imIiTGY=
=43Cv
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro