idendnummern zu identnummern

Ruth H�bner rh at zfl.gwz-berlin.de
Mi Sep 1 13:44:20 CEST 1999


Trotz Befürchtung die Liste öde zu langweilen: Das Problem interessiert
mich, ich füchte jedoch, es einfach noch nicht verstanden zu haben.

Klaus Lehmann schrieb:

> fr. huebner, so entnehme ich aus der antwort, arbeitet genau so: jede
> verschiedene quelle hat seine eigene kennnummer. ok, nehmen wir mal an, sie
> hat 10 quellen. ok #00 sieht so aus: #00 xxxa??????? bis #00 xxxb???????
> das a oder das b steht fuer die quelle. a bis z sind also max. 32 quellen.

Da man auch mehrere Buchstaben nehmen kann, sind es ziemlich viele
mögliche Quellen. Aber ich kann mir gar nicht vorstellen, daß Sie aus
mehr als 32 Quellen Daten importieren, ist das nicht viel zu aufwendig
in der Vorbereitung, um noch sinnvoll zu sein? (Ich meine mit Quelle die
Ursprungsdatenbank der einzuspielenden Daten, nicht die einzelne daraus
exportierte Datei.) 

> ??????? stehen fuer das 7stellige nummernsystem. und meinetwegen xxx fuer eine
> art sigel: berliner bibliothekssigel z.b.

Also dieses xxx ist vermutlich das, was ich mit dem Kennbuchstaben
meine: Kennzeichen der Ursprungsdatenbank.

> ich kann das spielchen mit dem datenanfuegen NUR 23 mal machen, WENN ich die
> letzten verwendeten nummern NICHT weiss.
> Aaaber: wenn ich weiss: meine quelle a hat bei xxxa0000001 angefangen, letzte
> woche definitiv bei xxxa0001234 aufgehoert, dann kann ich quelle a
> WIEDERbenutzen, und ohne gefahr neue daten aus quelle a zuspielen
> (ab xxxa0001235, naturelement mit einem #00-hochzaehler wie es h. fischer in
> seiner mail aufgezeigt hat.

Sie müssen doch die letzten verwendeten Nummern nicht wissen. In jeder
Datenbank wird jede Identnummer nur einmal vergeben, wenn Sie also
erneut Daten daraus einspielen, und den darin enthaltenen Identnummern
den Kennbuchstaben voranstellen (und zwar in einem _Import_vorgang, der
geht auch schön schnell), dann können keine Doppelungen auftreten. Sätze
ohne Identnummer bleiben unberücksichtigt, diese erhalten in der
Importroutine auch keine Kennbuchstaben oder Identnummern, sondern sie
erhalten beim Update wie üblich die in der Zieldatenbank verwendete Art
von Identnummer, wodurch natürlich dann keine Kennzeichnung der Herkunft
mehr vorhanden ist; wenn man das auf jeden Fall möchte, muß man beim
Import noch ein extra Feld anlegen mit Quellenangabe. Der Vorteil dieser
Methode ist darin zu sehen, daß zwischen der Identnummer des Satzes in
der Ursprungsdatenbank (falls eine vorhanden ist!) und der Identnummer
in der Zieldatenbank eine eindeutige (oder ein-eindeutige?) Beziehung
besteht und diese in jeder Richtung zu rekonstruieren ist, so daß sogar
Änderungen eingespeist werden können.

Oder ist das Problem eher kosmetisch: die Identnummern sollen in der
Zieldatenbank eine gleichmäßige Struktur haben und keine Lücken
aufweisen? Hat so etwas Vorteile? Und wenn ja, welche?

Eine Schwierigkeit entsteht natürlich wirklich, wenn man viele Quellen
hat, aus denen man importiert, und dieses hängt mit dem "menschlichen
Faktor" zusammen: eine kleine Verwechselung und es wird mit der falschen
Importparameterdatei gearbeitet, die zu einer anderen Quelldatenbank
gehört und schon hat man unter Umständen wirklich ein Problem mit
doppelten Identnummern, aber der "menschliche Faktor" ist ja sowieso DAS
Riesen-Risiko schlechthin für jede Datenbank.

Verregnete Grüße
-- 
Ruth Hübner
___________________________________________
Zentrum für Literaturforschung - Bibliothek
                    
Jägerstr. 10/11     
D - 10117 Berlin  

Tel: ++49 - 30 - 20192 172
___________________________________________




Mehr Informationen über die Mailingliste Allegro