[Allegro] Mal wieder was zu GND
Bernhard Eversberg
ev at biblio.tu-bs.de
Fr Okt 12 12:23:45 CEST 2012
Am 12.10.2012 10:27, schrieb Bernhard Eversberg:
>
> 150 Luthertum
> 550 !106335138!Evangelische Kirche ; ID: gnd/4015833-0$4obal
> 550 !106194321!Protestantismus ; ID: gnd/4047538-4$4obal
> 550 !105418226!Lutheraner ; ID: gnd/4168344-4$4vbal
> 550 !105737429!Lutherische Kirche ; ID: gnd/4125794-7$4vbal
> 670 M
>
> Die 550 bedeutet "Sachbegriff - Beziehung". Nur gibt es vielerlei
> Beziehungen. In diesem Fall 2, gekennzeichnet im $4 mit "obal"
> bzw. "vbal", und das heißt "Oberbegriff allgemein" bzw.
> "Verwandter Begriff". Es gibt noch viel mehr solche GND-Codes.
> Das Problem beim Import ist: Wenn man gezielt die Oberbegriffe
> haben will - wie macht man das?
>
Wegen anderer Anforderungen mußte ich das erst mal unterbrechen.
Inzwischen hat ein Gedanke sich erhoben, der jedem einschlägig
indoktrienierten Programmierer auf der Hand liegt: Eine Auswertung
regulärer Ausdrücke muß her. Damit griffe man die Zeilen raus,
in denen vorn 500 steht und weiter hinten $4obal etc. Und eine
Schleife könnte diese dann verarbeiten.
Ja. Nur ist erstens die Importlogik eine sehr verzwickte, die
nicht stets und ausschließlich mit zeilenweise strukturiertem
Material umgehen zu können braucht, und zweitens ist das mit dem
schleifenförmig verarbeiten und die jeweilige Zeile auch noch
umstrukturieren immer noch ein Problem. Also m.a.W., das
Integrieren einer vollständigen regulären Ausdrucksmechanik
scheint mir utopisch. Eine recht einfache Teillösung, die für
den in Rede stehenden Fall reicht, könnte in einer
schlichten Erweiterung der Syntax der s-Befehle bestehen:
#nnn
s 0 "500 .*$4obal"
...
m"; "
würde nur diejenigen Zeilen herausfischen, die mit 500 beginnen
und weiter hinten $4obal enthalten. Das würde mit .*... erreicht.
Mehr nicht. Keine weiteren regulären Finessen vorerst.
Wir prüfen mal die Mach- und Anwendbarkeit.
B.E.
Mehr Informationen über die Mailingliste Allegro