Import; wrong recn..../Marginalia

Thomas Berger thomas at mpim-bonn.mpg.de
Fr Sep 22 13:07:50 CEST 1995


Herr Hoeppner schrieb:

>                            Eine schnelle Loesung fuer mich war (Bernhard: 
> bitte das folgende nicht lesen!): Ich benutze ein Perl-Script als 
> Importprogramm. Das Zerpfluecken und aufbereiten der Mails war damit 
> unproblematischer und ging schneller, als die Fehlersuche in der 
> Importparameterdatei. Die Email-Datenbank ist fuer mich schliesslich nur ein 
> 'Abfallsprodukt', das moeglichst schnell arbeitsfaehig sein sollte.
> 
> Um etwaigen aufkommenden Geruechten vorzubeugen: Trotz des Einsatzes von 
> Perl bin ich nicht vom rechten allegro-Glauben abgefallen!

perl hat ganz gigantische Vorteile, ist aber kein Konkurrent fuer
das Allegro-Importmodul: Dessen Staerke liegt eigentlich in der
Importfaehigkeit fuer Saetze mit variabler Feldanzahl und Feldlaenge.
Typischerweise steht dort in jeder Zeile eine Kategorie und die Enden
der Datensaetze sind durch Mehrfachleerzeilen gekennzeichnet.
Solche Strukturen mit perl umzuwandeln ist nicht sehr erfreulich.

Umgekehrt ist die Staerke von perl (wie von allen 'Unix-Tools' die
strikt zeilenweise Textverarbeitung: Suche, Konversion von Zeichen
und Aufbereitung in solchen Daten geht mit perl schneller und praeziser
als mit dem Allegro-Importmodul. Man hat die Moeglichkeit Kontroll-
strukturen (Schleifen, Bedingte Verzweigungen, Variable) fuer seine
Zwecke einzusetzen. 

Die aus heutiger Sicht effizientesten Importe stellen sich mir so dar:
Vorbereitung von Fremddaten mit perl, dabei Zeichenkonvertierungen, 
Erkennung und Behandlung von Fortsetzungszeilen und Mehrfachkategorien
sowie evtl. Trennung von Kategorien (solche die intern strukturiert 
sind UND innerhalb der Kategorie ueber ein Trennzeichen wiederholbar
machen dem Importmodul doch grosse Probleme) falls noetig.
Danach Import der Aufbereiteten Daten mit dem Importmodul.
Ob - bei komplizierten Importen keien Seltenheit - eine Nachbearbeitung
mit anderen Exportparametern als I1.cPR oder mit perl besser ist,
ueberlasse ich im Moment noch dem Streit.

Gruesse
Thomas Berger

P.S.: perl gibt es auf dem allegro-Fileserver der TU-BS im Verzeichnis
utility, Name ist perl40bi.
Empfehlenswert ist aber Big Perl (eine Compilierung fuer MSDOS, die 
Speichererweiterungen nutzt. Sie ist z.B. erhaeltlich von  

Host news.rrz.uni-koeln.de    (134.95.100.202)
    Location: /pc/msdos/gnuprogs
      FILE    -rw-rw-r--  487401 bytes  22:00 22 Oct 1994  bperl4x.zip

Th. B.

PP.S.: Ich werde naechste Woche eine Anwendung fuer perl vorstellen,
die nur unter Big Perl laeuft.



Mehr Informationen über die Mailingliste Allegro