AW: [Allegro] Update

Thomas Fischer fischer at sub.uni-goettingen.de
Di Mai 20 17:02:02 CEST 2008


Hallo Herr Berger,

danke für die Hinweise.

> | ich kämpfe mit einer verworrenen Updateaufgabe:
> | In unseren wie auch den einzuspielenden Daten gibt es:
> | - eine Kennnummer (aber bei uns nicht immer
> |   und bei den externen Daten nicht eindeutig)
> | - eine URL
> | - einen Datenbesitzer
> |
> | Ich möchte jetzt:
> | - Die Datensätze mit den URLs importieren. die bei uns nicht da sind
> | 	(Primärschlüssel URL, Modus: 21)
> 
> bekommen Sie da nicht massenhaft Dubletten, wenn in den 
> fremden Daten seit dem letzten Mal die URL aktualisiert 
> worden ist (so richtig persistent sind die Burschen ja nicht)?

einige wohl, die müsste ich im Nachhinein aufspüren (über Titel oder besagte Kennnummer), ich hoffe, dass das überschaubar bleibt.

 
> | - Von den übrigen Datensätzen diejenigen übernehmen, deren 
> Kennnummer
> |   nicht mit einer bei uns schon vorhandenen übereinstimmt
> | 	(Primärschlüssel Kennnummer, Modus 21)
> | - Von den übrigen Datensätzen diejenigen aktualisieren, die 
> nicht von
> *uns*
> | sind
> | 	(Primärschlüssel Kennnummer, Modus ?0)
> |
> | ich sehe derzeit noch nicht, wie ich das Fragezeichen in der obigen 
> | Zeile loswerde. Für Hinweise wäre ich sehr dankbar.
> 
> wenn die Kennummer in den externen Daten nicht eindeutig ist, 
> machen Sie damit aber u.U. mehr kaputt als es nutzt.

Es gibt mit derselben Kennnummer verschiedene Versionen desselben Satzes, und ich versuche, die "besseren" oder neueren weiter hinten stehen zu haben, so dass eventuell mehrfach erneuert wird, zum Schluss aber eine gute Version stehen beleibt.

Ich merke aber schon, dass bei mir ein Gedankenfehler drin steckt:
Im ersten Durchgang die "neuen" URLs ist OK.
Dann bräuchte ich die übrig bleibenden Datensätze, zu denen URLs schon vorhanden sind, da hoffte ich, dass ich die mit dem Export vom ersten Durchgang bekommen könnte.

Danach darf ich nur noch die identifizierten URLs verwenden und die Datensätze mit diesen URLs erneuern, die nicht von uns sind.
Also gar keine Kennnummern als Primärschlüssel, sondern weiterhin URL mit einem Modus x0, mit
x = 4  wenn Besitzer != SUBGö
x = 2  wenn Besitzer != SUBGö

Das müsste alles beim ersten Durchgang irgendwie erhoben werden.
Ich habe aber noch nicht herausgefunden, was beim Export geschrieben wird, nur auch schon gemerkt, dass "sich die Ausgaben der Parameter und 
> diagnostische Meldungen wie "vorhandener Datensatz" mischen.

 
> Damit wird v.a. manipuliert. Ich nutze das gerne, um 
> Mischmodi aus den verschiedenen -fm  zu fahren, also z.B. #20 
> wird stets aktualisiert, #81 nie etc. a99 hat das 
> betrueblicherweise nicht.

Wie manipulieren Sie dort?
 
Mit freundlichen Grüßen
Thomas Fischer 




Mehr Informationen über die Mailingliste Allegro