Projekt: imdb -sackgasse?
Klaus Lehmann
lehmann_klaus at t-online.de
Di Feb 11 19:50:31 CET 2003
On Mon, 10 Feb 2003 22:37:00 +0100, Thomas Berger wrote:
guten abend herr berger
/gleichzeitig auch an herrn th. fischer/
kl>Aus den 92 Nennungen zu Adolph Zukor in der producers_list muessen
kl>Sie dann 92 einzelne Datensaetze machen, die jeweils in einem
kl>Update-Lauf dafuer sorgen, dass die #40p im "Titel"-Satz erzeugt
kl>bzw. ergaenzt wird (das geht ueber einen globale-Manipulations-
kl>Abschnitt in der Parameterdatei, die Sie schreiben und dann mit
kl>dem Schalter -e beim Update angeben muessen).
kl>D.h. Sie sollten 92 Saetze erzeugen, die jeweils #20 und #40p
kl>enthalten, der Rest passiert beim Update.
ja, das hatte ich bereits so ähnlich geschrieben. das problem ist, wie bekommt man den #40p eben
reinmultipliziert in die alg-datei? ja: mittels einer aim-datei. da sehe ich noch keinen weg.
kl>Vermutlich ist es am praktischsten, sich auf die Leerzeile
kl>zwischen zwei Personen zu verlassen, d.h. die Importparameterdatei
kl>sammelt den Personennamen plus die 92 Titel und zugehoerige
kl>Funktionsbezeichnungen ein, der beim Import mit Schalter -e
kl>nachgeschaltete Export erzeugt dann die richtige Anzahl von
kl>Saetzen mit duplizierter Person.
breite zustimmung...
kl>Also:
kl>Person <tab> Movie A (Funktion A)
kl><tab><tab><tab> Movie B (Funktion B)
kl>wird letztendlich zu
kl>#20 Movie A
kl>#40pPerson (Funktion A)
kl>#20 Movie B
kl>#40pPerson (Funktion B)
kl>(dabei ist #40p "provisorisch", weil diese Kategorie beim
kl>Update die #40p im Zielsatz ergaenzen, nicht ersetzen muss)
ebenfalls breite zustimmung
anders geht es garnicht, das hatte ich in den mails vorher dargestellt.
kl>Die Daten sehen so aus, als sollte man beim Import am besten
kl>Zeilendende TAB TAB TAB durch ein eindeutiges Trennzeichen
genau, weil nie garantiert ist, daß es drei tabs sind. aber dazu habe ich "meine" tools, die suchen die
masse ab, und machen aus x-vielen tabs etwas einzelnes (eindeutiges).
kl>ersetzen, die uebriggebliebenen Tabs (das sind dann nur die
kl>in der erste Zeile) zu einem zusammenschnurren. Dann haben
kl>Sie eine Tabelle mit zwei Spalten, dabei ist die zweite
kl>Spalte allerdings zweifach unterstrukturiert (eine Liste
kl>von Tripeln Film, Genre, Funktion), das Zerhacken macht dann
kl>der nachgeschaltete Export.
ich habe das gefühl, beim trippeln bleibt es nicht. es scheint mir eine "mehrfachdimensionale" datenbank zu
sein, oder: besser zu werden.
für herrn fischer: wie oben schon angedeutet, ich denke mal, daß ich das geeignete werkzeig habe, was das
manipulieren dieser dateninhalte angeht. aus den vielen tabs etwas eineindeutiges zu machen. z.b. warum
nicht gleich \000#20\032 allegro_leerzeichen#20normales_leerzeichen (so ähnlich)
mein problem bleibt erstmal, wie man die person (#40p) eben in die zeilen "reindupliziert".... derzeit wie
gesagt, keine lösung....
soviel erstmal
viele grüße
ihr
k.l.
-
Klaus Lehmann
eMail: lehmann_klaus at t-online.de
phone: 030-8950 3156; mobil 0171-953 7843
*** Allegro-C-Dienstleistungen:
Datenbankbereinigungen, safer shells, komplette
Arbeitsumgebungen, Fehlerindices, Fremddatenimport/Export;
Batchprogrammierung & andere Automatismen
Admin Netware/WinNT/W2K/VÖBB Friedrichshain-Kreuzberg;
*** Our best ideas are born at home (New Freedom Data Center 1995) ***
Mehr Informationen über die Mailingliste Allegro