Projekt: imdb -sackgasse?

Klaus Lehmann lehmann_klaus at t-online.de
Mo Feb 10 15:43:16 CET 2003


werte kollegen


ich geb's zu, bin in einer sackgasse.
gibt es einen weg hinaus?

im anhang ein schönes beispiel aus strassenatlas der imdb ;-)
sehr schön mit seinen zeilenenden, sowie tabs für die optische präsentation.

was geht nicht? 
bzw. was führt in die sackgasse?


nur mal auszugsweise, damit wir was zum gucken haben:
Zukor, Adolph           Amarilly of Clothes-Line Alley (1918)  (executive pro
                        Amours de la reine  lisabeth, Les (1912)  (producer:
                        Away Goes Prudence (1920)  (producer)
                        Beau Geste (1926)  (producer)
                        Beggars of Life (1928)  (executive producer)

es ist kein problem, aus dem EL-zeichen ein EL+CR-zeichen zu machen. 
(EL=end-of-line, CR carriage return; pure EL-enden sind aus der unix-welt beliebt/bekannt; wir kennen mehr: 
EL+plus+CR-Enden.

es gibt mehrere wege, weiterzugehen:
(es ist ja alles gut definiert, man muss es nur sehen ;-)


a. man kann den datensatz zu Adolphe Zukor so gestalten, daß der Adolf eine #40p bekommt (p für produzent); 
die von ihm produzierten Titel bekommen alle eine #20(mit leerzeichen \032) und so. damit enthält der EINE 
datensatz 1x #40p und x-viele #20 (genau 92 Stück) dahinter. 
so geht das nicht!


b. man nehme die alte lösung: einer oben, viel unten. (hierarchisch)
#40p und #01 #20 titel1 #01 #20 titel2 bis #01 #20 titel92!!!!
(#01 nur hier angedeutet: es ist sonst: "grinsemännchen"01)
so geht das ebenfalls nicht! warum? zuviele #01'er!!!! lässt sich z.b. nicht indexieren. der datensatz (es 
befindet sich alles! in EINEM datensatz!) ist einfach zu lang.


zwischenspiel:
die verwendeten zeichensätze, ob asci oder ansi (s.a. hierzu h. bergers richtigstellung!) die lassen wir mal 
beiseite. solange nicht spezielle allegro-steuerzeichen verwendet werden wie \000 (hex00), ist alles prima.
die diskussion, die ich angefangen habe, hat vom eigentlichen problem leider abgelenkt.


wie könnte nun der datensatz für herrn zukor aussehen?
ich vermute, es wird 92 datensätze geben.
der 1. datensatz besteht aus 1x #40p und 1x #20 Amarilly....
der letzte (92.) besteht aus 1x #40p und 1x #20 Zaza.

nur, welches tool kann dieses wunder vollbringen?
adolphe zukor ist eindeutig als #40p definiert. nach jeweils ZWEI EL's (\010) kommt der producer. innerhalb 
des producer-satzes gibt es jeweils immer nur 1x ein EL. es müsste also ein tool geben, welches den ersten 
inhalt: "Zukor, Adolph" dahernimmt, und vor jede zeile nach einem EL hinschreibt plus ein paar TABs.
dann hätte man kurze datzensätze.
kann das import.exe? und wenn ja: wie?

bemerkung: zwischen dem producent und dem titel muss es nicht immer 3 TABs geben. mal mehr, mal weniger; es 
scheint eine rolle zu spielen, ob es mehr als einen titel danach gibt.(?)



etwas ratlos erstmal
(vielen dank für weitere gute ideen)
viele grüße
ihr
k.lehmann

-
Klaus Lehmann
eMail: lehmann_klaus at t-online.de
phone: 030-8950 3156; mobil 0171-953 7843
*** Allegro-C-Dienstleistungen: 
Datenbankbereinigungen, safer shells, komplette 
Arbeitsumgebungen, Fehlerindices, Fremddatenimport/Export;
Batchprogrammierung & andere Automatismen
Admin Netware/WinNT/W2K/VÖBB Friedrichshain-Kreuzberg;
*** Our best ideas are born at home (New Freedom Data Center 1995) ***

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : producer.lst
Dateityp    : application/octet-stream
Dateigröße  : 4780 bytes
Beschreibung: nicht verfügbar
URL         : <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20030210/a1a78bc0/attachment.obj>


Mehr Informationen über die Mailingliste Allegro