Re-2: [Allegro] 13 10-Problem bei manuell bearbeiteter Tabelle

Thomas Fischer fischer at sub.uni-goettingen.de
Mo Feb 15 12:32:54 CET 2010


Hallo Herr Deblon,

ich habe noch nicht ganz verstanden, was der Zweck Ihrer Aktion ist.
Nur zwei Dinge sind mir direkt aufgefallen:
1. Wenn ich eine Word-Tabelle in Text umwandle, tue ich das i zwei Schritten:
– zuerst Umwandlung der Tabelle in Text, damit werden die Zell-Trennzeichen zu Tabulatoren (bzw. einem anderen Zeichen,das Sie wählen können), die einfacher zu verarbeiten sind
– dann Umwandlung der so entstandenen Datei in Text
2. Wenn ich ein Word-Dokument in Text umwandle, kann ich die Textkodierung festlegen. Wenn ich Unicode UTF-8 wähle, bleiben die asiatischen Zeichen in Ihrem Text erhalten (ich weiß nicht, ob das nützlich ist).

Mit freundlichen Grüßen
Thomas Fischer

__________
Dr. Thomas Fischer
Metadaten und Datenbanken
Staats- und Universitätsbibliothek Göttingen
37070 Göttingen
Germany
Tel.: +49 551 393883
und  +43 662 621498

Am 13.02.2010 um 20:56 schrieb Christoph Deblon:

> CSID +49 7425 336433 fax
> CSID deblon at mh-trossingen.de email
> 
> CSID +49 7425 336433 fax
> CSID deblon at mh-trossingen.de email
> 
> Liebe Frau Koczian, lieber Herr Allers, lieber Herr Berger,
> 
> herzlichen Dank für Ihre Antworten!
> 
> Inzwischen bin ich zu einer sehr mäßig eleganten, aber mich einigermaßen zufriedenstellenden Lösung gekommen: der RTF-Tabelle (die aus Allegro-Export + Word-Umwandlung stammt) wird noch eine weitere Spalte spendiert, die mit "EOR" o.dgl. gefüllt ist. Wenn ich diese Spalte schmal mache, sieht es wie eine Schlußleiste aus und stört wenig. Damit habe ich eine Kennzeichnung des Zeilenendes, z.B. re="EOR" 13 und kann, wie von Herrn Berger vorgeschlagen, einen Import nach Typ C vornehmen. Auch die globale Ersetzung 13 10 --> " " funktioniert dann wunschgemäß.
> 
> Frau Koczians Gedanke, einen anderen Feldtrenner zu bestimmen, wäre natürlich weit elganter - wenn jemand da etwas weiß? Die Tabellenstruktur der Vorlage scheint aber schon die sonst übliche Variabilität zu beeinträchtigen - s. unten.
> 
> Ich darf mir vielleicht noch erlauben, Ihre Fragen zu beantworten und das schon vorbereitete Anschauungsmaterial beizufügen.
> 
> zu Allers:
> - ich benutzte Word zur Umwandlung von RTF-Tabelle --> Text ("Speichern unter")
> - die RTF-Vorlage enthält, wie Sie sofort sehen, RTF-Unicode, der bei der Umwandlung in Text verlorengeht (Word warnt auch entsprechend), ich benötige diese Textelemente aber nicht mehr, es scheint nicht zu schaden, denn ohne den 13 10-Fehler funktioniert alles tadellos.
> - die manuellen Eintragungen mache ich mit Word als Editor, da gibt es auch kein Alternative, weil diese Eintragungen später von diversen Personen (zwecks einer Art "Ranking" der Tabelleneinträge) gemacht werden sollen. 
> 
> zu Berger und Koczian:
> - Word setzt bei der Umwandlung RTF-Tabelle --> Text offenbar die "13" als Trennzeichen, das Zeilenende wird m.E. nicht besonders markiert. Die Varianten, die von Word bei der Umwandlung RTF-->Text angeboten werden, scheinen alle außer Kraft zu sein, wohl weil die Vorlage eine Tabelle ist (grade weil Frau Koczian bei diesem Punkt nachfragt, muß ich aber betonen, daß dieser Eindruck von mir nur auf oberflächlichem aktuellen Probieren beruht, nicht auf weitergehenden Kenntnissen).
> 
> ---
> 
> Ich füge zwei "Sets" bei, die das Problem (also nicht die oben angedeutet "Lösung") zeigen können:
> 
> (1) AMLplus.RTF --> AMLplus.TXT --> AMLplus.ALG
> (2) AMLminus.RTF --> AMLminus.TXT --> AMLminus.ALG.
> 
> Die "plus"-Dateien sind "sauber", und es funktioniert alles wie gewünscht, in die letzte Spalte von AMLplus.RTF sind manuelle Einträge (Zifferngruppen wie 221 etc.) vorgenommen worden, aber korrekt ohne Zeilenschaltung.
> 
> Bei den "minus"-Dateien haben ich in der RTF-Datei zu Anfang in der 7. Zeile (Q 10-3) in der letzten Spalte eine Zeilenschaltung quasi als "Fehler" eingefügt (23//3 statt 233), und man kann in AMLminus.ALG sehen, daß die Ausgabe genau an dieser Stelle aufhört.
> 
> Außerdem die beiden ganz simplen Parameter für den Import.
> 
> ---
> 
> Viele Grüße,
> Christoph Deblon
> Staatlicheh Hochschule für Musik / Bibliothek
> Schulheiß-Koch-Pl. 3
> 78647 Trossingen
> Tel. 07425/949133
> eMail deblon at mh-trossingen.de
> 
> 
> 
> -------- Original Message --------
> Subject: Re: [Allegro] 13 10-Problem bei manuell bearbeiteter Tabelle (12-Feb-2010 17:28)
> From:    Heinrich Allers <allers at t-online.de>
> To:      Deblon at mh-trossingen.de
> 
>> Hallo Herr Deblon:
>> 
>>> es liegt eine RTF-Tabelle vor.
>>> Diese soll in eine Text-Datei konvertiert werden,
>> 
>> In eine pure Textdatei, also des Typs .txt?
>> 
>>> bei Umwandlung mit Word werden die dabei die Zellentrennungen durch Code 13 
>>> dargestellt.
>> 
>> Sie benutzen Word also dafür, um aus der RTF-Datei eine Text-Datei zu 
>> machen?
>> 
>>> Die Text-Datei soll per import in eine ALG-Datei überführt werden.
>>> 
>>> Ein Problem entsteht dadurch, daß in der RTF-Tablelle manuelle Eintragungen 
>>> gemacht werden sollen.
>> 
>> Diese manuellen Eintragungen in der RTF-Datei machen Sie unter Benutzung 
>> von Word als Editor?
>> 
>>> Wenn man dabei <enter> betätigt, steht in der Textdatei an dieser
>>> Stelle eine 13 10. Das stört natürlich die Dateistruktur, und der
>>> Import wird fehlerhaft.
>> 
>> Klar. (Ich kenne das Problem in ähnlicher Form von früher: damals mußte ich 
>> die "13 10" von Hand
>> herauswerfen).
>> 
>>> Wenn es eine einfache (d. h. mit Allegro-Mitteln realisierbare)
>>> Möglichkeit gibt, das abzufangen, wäre es im gegebenen Falle
>>> arbeitsorganisatorisch günstiger, als zu versuchen, die Betätigung
>>> von enter zu unterbinden.
>> 
>>> Ich habe es mit globaler Ersetzung in den Importparametern versucht:
>>> 
>>> _ 13 10
>>> _ "" oder " "
>>> 
>>> das funktioniert nicht,
>> 
>> Seltsam.
>> 
>> Um effektiv helfen oder einen Rat geben zu können, schlage ich Ihnen vor, 
>> daß Sie sowohl die RTF-Datei
>> als auch die Textdatei (zumindest auszugsweise) mit der von Ihnen beim 
>> Import benutzten Import- und
>> Exportparameterdatei zur Verfügung stellen. Mir zumindest fällts anhand 
>> konkreten Materials leichter,
>> etwas zu sagen, was weiterführt.
>> 
>> 
>> Mit besten Grüßen:
>> 
>> Heinrich Allers
>> 
>> allers at t-online.de * http://www.h-allers.de
>> Netztagebuch: http://heinrich-erlo-ger.blogspot.com/
>> Bitácora: http://heinrich-erlo-spa.blogspot.com/
>> 
>> _______________________________________________
>> Allegro mailing list
>> Allegro at biblio.tu-bs.de
>> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro
> <I-AML.APR><AML.AIM><AMLminus.ALG><AMLminus.TXT><AMLminus.RTF><AMLplus.ALG><AMLplus.TXT><AMLplus.RTF>_______________________________________________
> Allegro mailing list
> Allegro at biblio.tu-bs.de
> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro




Mehr Informationen über die Mailingliste Allegro