Projekt: imdb -sackgasse?

Thomas Berger ThB at gymel.com
Mo Feb 10 22:37:00 CET 2003


Lieber Herr Lehmann,

> kl>> wie könnte nun der datensatz für herrn zukor aussehen?
> kl>
> kl>#00 p?1
> kl>#4n Zukor, Adolph
> kl>#4nd $b1873-1976 $fm $iFilmproduzent ungar. Abstammung
> kl>#4nz $a IMDB
> 
> ja, das schwebt mir ja vor.
> für die titel wird es zumindestes kennziffern geben (stammsätze?)
> aber das alles kommt sehr viel später. wie holt man die 92 titelangaben des herrn zukor in eine alg-datei.
> (oder ist DAS der falsche ansatz?)

dafuer gibt es ja die movies_list, deren #20er sind gleichzeitig
die Primaerschluessel.

Aus den 92 Nennungen zu Adolph Zukor in der producers_list muessen
Sie dann 92 einzelne Datensaetze machen, die jeweils in einem 
Update-Lauf dafuer sorgen, dass die #40p im "Titel"-Satz erzeugt 
bzw. ergaenzt wird (das geht ueber einen globale-Manipulations-
Abschnitt in der Parameterdatei, die Sie schreiben und dann mit 
dem Schalter -e beim Update angeben muessen).

D.h. Sie sollten 92 Saetze erzeugen, die jeweils #20 und #40p 
enthalten, der Rest passiert beim Update.

Vermutlich ist es am praktischsten, sich auf die Leerzeile
zwischen zwei Personen zu verlassen, d.h. die Importparameterdatei
sammelt den Personennamen plus die 92 Titel und zugehoerige
Funktionsbezeichnungen ein, der beim Import mit Schalter -e
nachgeschaltete Export erzeugt dann die richtige Anzahl von 
Saetzen mit duplizierter Person.

Also:

Person <tab> Movie A (Funktion A)
<tab><tab><tab> Movie B (Funktion B)

wird letztendlich zu
#20 Movie A
#40pPerson (Funktion A)

#20 Movie B
#40pPerson (Funktion B)

(dabei ist #40p "provisorisch", weil diese Kategorie beim
Update die #40p im Zielsatz ergaenzen, nicht ersetzen muss)

Die Daten sehen so aus, als sollte man beim Import am besten
Zeilendende TAB TAB TAB durch ein eindeutiges Trennzeichen
ersetzen, die uebriggebliebenen Tabs (das sind dann nur die
in der erste Zeile) zu einem zusammenschnurren. Dann haben
Sie eine Tabelle mit zwei Spalten, dabei ist die zweite
Spalte allerdings zweifach unterstrukturiert (eine Liste
von Tripeln Film, Genre, Funktion), das Zerhacken macht dann
der nachgeschaltete Export.

viele Gruesse
Thomas Berger




Mehr Informationen über die Mailingliste Allegro