[Allegro] Anmerkungen zu i5=__

Thomas Berger ThB at Gymel.com
So Mai 5 19:37:42 CEST 2013


Lieber Herr Eversberg, liebe Liste,

in Verlautbarung 163 oder 164 wurde vor ca. 10 Jahren eine Erweiterung
des Schluesselersetzungsmechanismus eingefuehrt (und gleichzeitig mit
der Aussage, dass man nicht vorhabe, die Standardparameter darauf
umzustellen, zurueckgenommen), die eine freiere Syntax fuer die
als Schluessel moeglichen Zeichenfolgen vorsieht. Das war damals
schon attraktiv, weil viele Identifier ja eine mit "-" abgetrennte
Pruefziffer hatten, und ist es heute umso mehr, weil wir nicht zuletzt
durch den Uebergang von eine MAB-artigen auf eine MARC-artige Welt
einerseits und eine Web-Welt andererseits immer haeufiger mit
Identifiern konfrontiert sind, die geprefixt sind (etwa fuer GND-
Daten wahlweise bzw. je nach Kontext als "(DE-588)" oder
"http://d-nb.info/gnd/" ). Diese erweiterten Identifier sagen
also stets, /was/ sie sind, waehrend das bislang meist nur dann
determiniert war, wenn man wusste in welchem Datenfeld die
Identifier aufbewahrt wurden. Der Unterschied in der Datenhaltung
bei allegro ist im wesentlichen, dass hinter einem Schluessel
die abschliessende Wiederholung des Ersetzungs-steuerzeichens
nicht optional, sondern zwingend ist.

In diesem Zusammenhang habe ich einige Beobachtungen gemacht:

1.) Ersetzungsschluessel fuer diesen Mechanismus sind - vgl.
Handbuch gegen die Verlautbarung - im Register von der Form

<Steuerzeichen> Schluessel <Steuerzeichen> "=" [ "|" Registerprefix ] Text

also mit Gleichheitszeichen


2.) Ich hatte einen boesen Crash von index.exe, in einem langen
Textfeld eines Datensatz kam das Steuerzeichen durch einen Erfassungs-
fehler einfach vor, und zwar einige hundert Zeichen vor Feldende:
Das gab dann einen Ueberlauf in den entsprechenden Datenstrukturen,
die nur fuer Dinge dimensioniert sind, die man auch wirklich im Index
nachschlagen kann. Abgesehen davon, dass das bei Gelegenheit zu
beheben ist, frage ich mich, ob es eine tatsaechliche Einschraenkung
der Brauchbarkeit des Mechanismus waere, wenn das Programm sicherheits-
halber davon ausgehen wuerde dass solche "freien" Ersetzungsschluessel
keine Spatien enthalten.

Wir haben allerdings die "Originalform" der LCCN als ueblen Praezedenzfall,
diese "Nummern" enthalten oft sowohl doppelte Spatien als auch ein Spatium
als Abschluss! Allerdings habe ich hierzulande (in den PICA, MAB2, oder MARC-
Versionen von Personennormdaten, die in einigen zigtausend Faellen die
korrespondierenden LCCNs vermerken) noch nie LCCNs angetroffen, die diese
Feinheit aufrecht erhalten haetten, also "korrekt" gewesen waeren...

viele Gruesse
Thomas Berger






Mehr Informationen über die Mailingliste Allegro