projekt:imdb

Klaus Lehmann lehmann_klaus at t-online.de
So Mär 2 15:59:33 CET 2003


liebe mitleser
es entwickelt sich ;-)


bzw. man ist wieder an einem punkte steckengeblieben... 
a little help from my friends wäre da ganz nett...

ich berichtet ja so stolz von dem trick, der auf der letzten seite der update-doku zu lesen war: man solle 
das einzuspielende material mit einem ~ auf der ersten stelle des kat-inhalts versehen, und update werde 
schon machen (-fm41). und update macht! aber nicht alles! der sinn/zweck soll sein, daß wenn kat.xy bereits 
vergeben ist, eine kat xya oder xy1 aufgemacht wird, also es etwas darunter geschoben wird.


aber sehen sie selbst:
alg-material: (wird eingespielt mir update -fm41)

43 ~Kraike, Michael 20 Sierra (1950) 43 ~(producer) (as Michel Kraike)
und später
43 ~Kraike, Walter 20 Sierra (1950) 43 ~(producer)

falls das nicht lesbar ist: da oben soll stehen: feld mit leerzeichen, gefolgt von ~ auf erster 
feldinhaltsstelle.




das beisst sich!
in der ald steht dann sowas:
20 Sierra (1950) 42 Green, Alfred E. 43Kraike, Walter 43 Kraike, Michael 43a(producer) (as Michel Kraike) 
76 1950 

falls das nicht lesbar, auch hier wieder eine lesehilfe;:
kurz vor Kraike, Walter wirds interessant!
feld43; als drittes zeichen ist ein hex006 (das pik vom pik-as), der kraike, walter; daraufhin feld43 mit 
echtem leerzeichen, gefolgt von kraike, michael, sowie 43a mit inhalt (producer)

wenn obige ald indexiert wird, gibts ein durcheinander! 
allegro knackt den datensatz in der mitte durch (VOR dem Kraike, Walter!) 
warum ist das so?


grundlage der datenbank ist eine bündel ald's, die nur die #20 enthalten, diese bilden auch den 
primärschlüssel! in diese wird reingespielt. die produzenten bekommen eine #42'er gruppierung, die directors 
eine #43'er gruppe. jeweils in den #42'er und #43'er gibt es untergruppen mit ergänzenden angaben (z.b. 
#43a...)

solche querschiesser habe ich ca 1000 stück bei einem testvolumen von 342.000 stück. 
ich vermute, da spielt sich folgendes ab:
über den primärschlüssel wird der ERSTE produzent erfolgreich eingespielt. wenn es zusatzinfos gibt, diese 
mehrfach, dann helfen die ~ bei den feldinhalten.
WENN es einen zweiten produzenten gibt, sollte eigentlich die konstruktion der ~ dazu beitragen, daß z.b. 
#43a gebildet wird. er erzeugt leider #43\hex006. warum? es ist kein problem anscheinend bei den 
untergruppen.....

habe ich das klar und verständlich ausgedrückt?


das steht übrigens in der cfg drin:
#40"Verfasser"MaC d
#41"Hrsg"MaC d
#42"Mitarb"MaC d
#43"Bearb"MaC d
#44"Begr"MaC d


vielen dank für die mithilfe
ihr
klaus
 lehmann




ps: interessant ist übrigens: bei allen titeln, die ein AT-zeichen: @  (hex040) enthalten, wirkt das update 
-fm41 überhaupt nicht! jeder dieser einzuspielenden datensätze wird in die datei -n reingespielt! der 
primärschlüssel interessiert plötzlich nicht mehr! das betrifft nur ca 20-50 von 342.000 datensätzen, also 
eine sehr geringe zahl!!! aber trotzdem: warum? ist hex040 tabu?




-
Klaus Lehmann
eMail: lehmann_klaus at t-online.de
phone: 030-8950 3156; mobil 0171-953 7843
*** allegro-C-Dienstleistungen: 
Datenbankbereinigungen, safer shells, komplette 
Arbeitsumgebungen, Fehlerindices, Fremddatenimport/Export;
Batchprogrammierung & andere Automatismen
Admin Netware/WinNT/W2K/VÖBB Friedrichshain-Kreuzberg;
*** Our best ideas are born at home (New Freedom Data Center 1995) ***






Mehr Informationen über die Mailingliste Allegro