Mehrfache Dublettenpruefung

Sibylle Koczian Sibylle.Koczian at bibliothek.uni-augsburg.de
Do Jun 5 14:47:35 CEST 2003


Ein bisschen weiter bin ich selbst gekommen.

At 15:57 28.05.03 +0200, you wrote:
 >Liebe Liste,
 >
 >ich habe externe Daten, die in unsere Erwerbungsdatenbank hinein sollen.
 >Bei diesen Daten koennen Dubletten auf zweierlei Arten auftreten:
 >
 >- Die Titel koennen aus anderer Quelle schon in der Datenbank sein. Dafuer
 >habe ich schon lange eine Dublettenpruefung via ISBN eingerichtet (sie
 >wird voruebergehend als Primaerschluessel benutzt). Dass die ihre
 >Schwaechen hat, ist klar, aber fuer den vorgesehenen Zweck hat's bisher
 >gereicht.
 >
 >- Jetzt gibt es aber auch Titel mit abweichender ISBN, aber gleicher
 >ID-Nummer. Es sind alles Daten aus der Reihe N der DDB; es ist dann schon
 >immer der gleiche Titel, aber manchmal ist der Verlag anders, manchmal nur
 >die ISBN, in jedem Fall werden die beiden Varianten in unterschiedlichen
 >Heften angezeigt. Was inhaltlich genau dahinter steckt, weiss ich nicht.

Einerseits ergibt genaueres Hinsehen, dass der zunaechst benutzte Flex
seine Aufgabe nicht richtig erfuellt: er findet zwar die Dubletten-Saetze
und gibt sie auch richtig aus, soll dann aber auch den zugehoerigen
offline-Satz in die Dublettenliste schreiben und das tut er nicht: er
schreibt noch mal den gefundenen Datenbank-Satz, trotz "close res" davor.

Das ist wohl das gleiche Problem, das in anderen Zusammenhaengen schon
auftauchte: es wird normalerweise nur ein Dubletten-Satz in der Datenbank
gefunden, und der ergibt keine Ergebnismenge mit dem vollen Verhalten einer
solchen. Richtig?

Andererseits weiss ich inzwischen, was ich eigentlich brauche. Die
Doppelpruefung muesste im Prinzip durchaus moeglich sein:

- Updaten zur Probe mit "set u210", mit dem normalen Primaerschluessel
- In der jetzt existierenden Offline-Datei sind die ID-Nummer-Dubletten
nicht mehr drin
- Mit "download offline" diese Datei speichern,
- mit "erase offline" die bestehende Offline-Datei entfernen
- Die entstandene Datei fuer ein zweites Updaten zur Probe benutzen,
diesmal mit ISBN als Primaerschluessel (dafuer genuegt das Setzen einer
Anwendervariablen vor dem Update)
- Jetzt sind auch die ISBN-Dubletten weg
- "save offline"
- "erase offline"

Dies geht so _nur_ mit A99, weil weder Avanti noch das DOS-Update ein
Update zur Probe kennen - die wuerden alle Saetze wirklich einspielen, die
nach dem ersten Kriterium keine Dubletten sind.

Aber: beim DOS-Update kann ich die abgewiesenen Saetze in eine Liste
schreiben lassen, und das kann wieder A99 nicht. Mindestens fuer die
ID-Nummern-Dubletten waere das aber unbedingt noetig, denn hier haengt es
vom Zustand des vorhandenen Satzes ab, ob er durch den neuen ersetzt werden
soll oder nicht.

Was tun? Waere uebrigens die Dublettenliste fuer das Update mit A99 nicht
ueberhaupt ein Desiderat? Nach dem Probe-Update sehe ich die abgewiesenen
Saetze ja gerade nicht.

Beste Gruesse, Koczian


Dr. Sibylle Koczian
Universitaetsbibliothek, Abt. Naturwiss.
D-86135 Augsburg

Tel.: (0821) 598-2400, Fax : (0821) 598-2410
e-mail : Sibylle.Koczian at Bibliothek.Uni-Augsburg.DE





Mehr Informationen über die Mailingliste Allegro