[Allegro] Update-Dokumentation

Thomas Berger ThB at Gymel.com
Di Aug 6 10:46:10 CEST 2013


Lieber Herr Fischer,

>>> 4. Ich möchte die zurückgewiesenen Sätze in einer Datei sammeln, um sie
>>> später eventuell nachzubehandeln und/oder partiell zu importieren (das ist mein
>>> primärer Grund, es nicht mit A99 zu versuchen).
>>
>> so eine Aufteilung sollte man m.E. vor dem Update mit einem vorgelagerten
>> Export vornehmen.
> 
> Wie ginge das? Zum Hintergrund: Ich habe Dissertationsdaten recht
> unterschiedlicher Qualität aus unterschiedlichen Quellen, so dass ich nur den
> Namen der Autorin bzw. des Autors als Primärschlüssel einsetzen kann. Das ist
> plausibel, weil wenige Menschen zwei Dissertationen (schon gar nicht in einem
> Fach) schreiben und leider unpräzise, weil verschiedene Menschen manchmal
> denselben Namen haben…


Selbst wenn man mit dem Primaerschluessel trickst, bleibt eine Asymmetrie:

Der erste fuer den Fremdsatz tatsaechlich bestimmbare Schluessel "ist"
dessen Primaerschluessel fuer Updates und dergleichen, und nur dieser /eine/
wird gegen die Datenbank gematcht, d.h. alle dort gespeicherten Schluessel
aller Saetze.

In Match-&-Merge-Situationen ist das nach meiner Erfahrung oft nicht
wirklich das gewuenschte, sondern folgendes: Es gibt mehrere moegliche
Schluessel aus dem Fremddatensatz, ueber die ein Matching erfolgen kann.
Und erst wenn /keiner/ von denen in der Datenbank vorkommt, soll es
ein Neusatz werden.

Beispiel (stimmt so nicht fuer cat.api): Datensaetze haben entweder
ISBN-10 oder ISBN-13 oder beides, und die Indexierung rechnet nicht
das eine in das andere um: Dann koennte zufaellig die erste im
Fremdsatz gefuehrte ISBN keinen Treffer in der Datenbank haben, die
zweite aber wohl: Das bekommen Sie mit dem "Primaerschluessel"-Konzept
nicht in den Griff.

Man koennte nun einen individuellen Update.Job fuer genau diese
Situation programmieren, ich bevorzuge aber den Weg, in einem
vorgeschalteten (srch-)Lauf gezielt die Matchcodes gegen die Datenbank
zu testen und auszuwerten, und im Trefferfall die Identnummer aus
der Datenbank im Exportergebnis zu hinterlegen (und im mehrere-Treffer-
Fall, der ja im Fall allgemeiner Matchcodes keineswegs implizit "verboten"
ist, muss ohnehin etwas entschieden werden, z.B. verwerfen dieses Matchcodes
und Fortsetzung der Suche mit anderen, oder genauere Analyse des getroffenen
Satzes nach sekundaeren Kriterien).

Ein anschliessendes Update mit Standard-Primaerschluessel befolgt dann die
solcherart bereits fixierte Identifikation ganz exakt.

viele Gruesse
Thomas Berger



Mehr Informationen über die Mailingliste Allegro