Re: [Allegro] im vorfeld den/das längster datensatz/längstes feld ermitteln?

Thomas Fischer fischer at sub.uni-goettingen.de
So Mai 26 15:00:18 CEST 2013


Hallo Herr Lehmann,

> aber wie es im vorfeld erkennen? herrn bergers einzeiler hat nicht 
> wirklich was gebracht. ich verstehe auch die ministruktur des 
> einzeilers nicht. aber bin ja auch kein "perl-monk" ;-)

Herr Lackhoff hat ja schon etwas zu Herrn Bergers Einzeiler geschrieben.

Ich würde in dieser Situation meinen Texteditor öffnen und (mit aktiven regulären Ausdrücken) nach so etwas wie
[\x00]{9000,}
suchen, das findet dann Felder mit mehr als 9.000 Zeichen.
Leider unterstützt der WinVI diese Syntax nicht (ich benutze TextWrangler auf Mac OS X, da geht das).
Dann würde ich als zweiten Versuch ein Perl-Skript benutzen, allerdings bin ich kein Freund von Einzeilern, sondern eher ein Skript schreiben, das die Datei liest und so etwas wie

$i = 1;
while <>{
	print "$i: $_\n" if (/[\x00]{9000,}/);
	$i++;
}

enthält, und so die Zeilenzahl und die Zeile ausgibt, die Probleme bereiten könnte. Wenn Sie mehr dazu wissen wollen, können Sie gerne nachfragen, ich müsste ein wenig in meinen Skripten graben.

Haben Sie übrigens auch einmal getestet, dass der gesamte Datensatz nicht zu groß wird? Da liegt die Grenze wohl bei etwa 20.000.

Mit freundlichen Grüßen
Thomas Fischer



Mehr Informationen über die Mailingliste Allegro