Problem Dublettenkontrolle

Allers,Heinrich Heinrich.Allers at goethe.de
Mo Apr 28 14:11:23 CEST 1997


Monika Steffens (steffens at uni-oldenburg.de) schnitt
heute das ewige und doch immer wieder aktuelle Thema 
der Dublettenkontrolle an:

> ...
> "Fuer den Regionalkatalog Elbe-Weser sollen auf Basis von allegro-C 
> die Katalogdateien mehrerer Bibliotheken zusammengespielt werden,
> ....  die ISBN fuer die Dublettenkontrolle als 
> Pruefschluessel nicht geeignet; die Datenmenge ist andererseits aber 
> zu gross, als dass man Dubletten per Hand bearbeiten koennte 
> (insgesamt 10 Bibliotheken mit zusammen ca. 40.000 Titeln).
> 
> Frage: Wer hat Erfahrungen mit dieser Problemstellung und kann mir 
> sagen, wie man bei der Erstellung dieses Pruefschluessels am besten 
> vorgeht?"

Die technische Grundlage bilden die Index-Sonderbefehle f"ur 
Akronyme; in der letzten Ausgabe des Systemhandbuches auf 
S. 201 in 10.2.6.3 beschrieben.

Die praktische Gestaltung des Pr"ufschl"ussels h"angt sehr von
der eigenen Phantasie ab, die man an der tats"achlichen Qualit"at
des abzugleichenden Materials zu entwickeln hat.

Hier im Goethe-Institut wird von altersher folgender 
Pr"ufschl"ussel verwandt, der nur als Anregung verstanden
werden m"oge:

Einem Medientypskennbuchstaben folgt

#20 u K4 K2 K2 K1
#40 +#76 e4
#41 +#76 e4
#t{ "    " }
#76 x"*1" b2 e2
#77 x"*1" e"." r4,0 


Man soll sich keinen Illusionen hingeben: dieser Pr"ufschl"ussel
kann bestenfalls dazu dienen, die manuelle Arbeit beim Zusammen=
f"uhren gleicher Titel zu minimieren, indem man die 40.000 Titel
geeignet filtert und am Ende nur einige hundert oder wenige tausend
"ubrigbleiben, mit denen man sich abplacken mu"s.

Vielleicht k"onnte bei dieser manuellen Arbeit hilfreich 
sein das Programm MENUED.EXE, zu dem das j"ungst von 
Frau Tews erarbeitete Glossar 
(http://www.biblio.tu-bs.de/allegro/glossar/register.htm)
sagt: 

MENUED
hat die gleiche Funktionalität wie PRESTO. M. benötigt weniger Hauptspeicherplatz, arbeitet etwas langsamer und verfügt über 
einen menügesteuerten Editor. Der Menü-Editor wird mit der Taste 
<TAB> aufgerufen. Die Bearbeitung einer Kategorie erfolgt wie sonst
unter PRESTO mit dem b-Befehl. Für die Arbeit mit dem 
Hintergrundspeicher (z. B. Kategorien von einer Aufnahme in eine 
andere kopieren) gibt es spezielle Befehle. 
N"aheres in news 34. 
                                                                  -- 
### Zitat Ende ###

Komplizierter wird die Sache "ubrigens noch, wenn unter den
zu vergleichenden Datens"atzen auch solche sind, die mit
hierarchisch verkn"upften Unters"atzen geschlagen sind.
(Eine pragmatische L"osung hierf"ur haben sich die Bearbeiter
des Berliner Gesamtkataloges der "Offentlichen Bibliotheken
auf CD-ROM einfallen lassen, allerdings auf ISBN-Basis!).

Wenn es sich bei den zutragenden 10 Bibliotheken noch um lebendige
Datenbanken handelt, dann sollte man sich zweimal "uberlegen, ob
es lohnt, Arbeit in das Zusammenf"uhren von Titels"atzen zu 
stecken. Denn dann stellt sich das Problem: Wie macht man die
Aktualisierung des Gesamtkataloges?

Viel Spa"s!

Mit freundlichen Gr"u"sen:

Heinrich Allers

Goethe-Institut, M"unchen
heinrich.allers at goethe.de






Mehr Informationen über die Mailingliste Allegro