Projekt: imdb -sackgasse?

Klaus Lehmann lehmann_klaus at t-online.de
Di Feb 11 19:50:31 CET 2003


On Mon, 10 Feb 2003 22:37:00 +0100, Thomas Berger wrote:

guten abend herr berger
/gleichzeitig auch an herrn th. fischer/

kl>Aus den 92 Nennungen zu Adolph Zukor in der producers_list muessen
kl>Sie dann 92 einzelne Datensaetze machen, die jeweils in einem 
kl>Update-Lauf dafuer sorgen, dass die #40p im "Titel"-Satz erzeugt 
kl>bzw. ergaenzt wird (das geht ueber einen globale-Manipulations-
kl>Abschnitt in der Parameterdatei, die Sie schreiben und dann mit 
kl>dem Schalter -e beim Update angeben muessen).
kl>D.h. Sie sollten 92 Saetze erzeugen, die jeweils #20 und #40p 
kl>enthalten, der Rest passiert beim Update.

ja, das hatte ich bereits so ähnlich geschrieben. das problem ist, wie bekommt  man den #40p eben 
reinmultipliziert in die alg-datei? ja: mittels einer aim-datei. da sehe ich noch keinen weg.



kl>Vermutlich ist es am praktischsten, sich auf die Leerzeile
kl>zwischen zwei Personen zu verlassen, d.h. die Importparameterdatei
kl>sammelt den Personennamen plus die 92 Titel und zugehoerige
kl>Funktionsbezeichnungen ein, der beim Import mit Schalter -e
kl>nachgeschaltete Export erzeugt dann die richtige Anzahl von 
kl>Saetzen mit duplizierter Person.

breite zustimmung...




kl>Also:
kl>Person <tab> Movie A (Funktion A)
kl><tab><tab><tab> Movie B (Funktion B)
kl>wird letztendlich zu
kl>#20 Movie A
kl>#40pPerson (Funktion A)
kl>#20 Movie B
kl>#40pPerson (Funktion B)
kl>(dabei ist #40p "provisorisch", weil diese Kategorie beim
kl>Update die #40p im Zielsatz ergaenzen, nicht ersetzen muss)

ebenfalls breite zustimmung
anders geht es garnicht, das hatte ich in den mails vorher dargestellt.


kl>Die Daten sehen so aus, als sollte man beim Import am besten
kl>Zeilendende TAB TAB TAB durch ein eindeutiges Trennzeichen

genau, weil nie garantiert ist, daß es drei tabs sind. aber dazu habe ich "meine" tools, die suchen die 
masse ab, und machen aus x-vielen tabs etwas einzelnes (eindeutiges).

kl>ersetzen, die uebriggebliebenen Tabs (das sind dann nur die
kl>in der erste Zeile) zu einem zusammenschnurren. Dann haben
kl>Sie eine Tabelle mit zwei Spalten, dabei ist die zweite
kl>Spalte allerdings zweifach unterstrukturiert (eine Liste
kl>von Tripeln Film, Genre, Funktion), das Zerhacken macht dann
kl>der nachgeschaltete Export.
ich habe das gefühl,  beim trippeln bleibt es nicht. es scheint mir eine "mehrfachdimensionale" datenbank zu 
sein, oder: besser zu werden.


für herrn fischer: wie oben schon angedeutet, ich denke mal, daß ich das geeignete werkzeig habe, was das 
manipulieren dieser dateninhalte angeht. aus den vielen tabs etwas eineindeutiges zu machen. z.b. warum 
nicht gleich \000#20\032  allegro_leerzeichen#20normales_leerzeichen (so ähnlich)
mein problem bleibt erstmal, wie man die person (#40p) eben in die zeilen "reindupliziert".... derzeit wie 
gesagt, keine lösung....



soviel erstmal
viele grüße
ihr
k.l.




-
Klaus Lehmann
eMail: lehmann_klaus at t-online.de
phone: 030-8950 3156; mobil 0171-953 7843
*** Allegro-C-Dienstleistungen: 
Datenbankbereinigungen, safer shells, komplette 
Arbeitsumgebungen, Fehlerindices, Fremddatenimport/Export;
Batchprogrammierung & andere Automatismen
Admin Netware/WinNT/W2K/VÖBB Friedrichshain-Kreuzberg;
*** Our best ideas are born at home (New Freedom Data Center 1995) ***






Mehr Informationen über die Mailingliste Allegro