Re: AW: RTF-Exporte (war: AW: [Allegro] Aufruf von Word über Flex)

Thomas Berger ThB at Gymel.com
Do Okt 23 16:42:01 CEST 2008


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Fischer,

>> Wenn man aber vom Register aus auf Textnummern verweisen will 
>> und nicht auf Seitenzahlen, dann merkt man, dass z.B. Word 
>> gar nicht dafuer gebaut ist und man muss ziemlich tricksen. 
>> Ausserdem hat man da den Bereich von RTF schon laengst 
>> verlassen und ist im Bereich der Word-Platzhalter fuer 
>> bestimmte Formatierungsaufgaben (definiert im Zusammenhang 
>> mit VBA? keine Ahnung).
> 
> Was sind Textnummern? Sobald das nummerierte Bestandteile des
> Textkorpus sind, kann man mit RTF darauf verweisen (mit Fields).

Klar. Wenn man die aber im Index sehen will statt der eher
belanglosen Seitenzahlen, dann wird es haarig, weil man
(wenn ich mich recht entsinne) keine normalen Indexeintraege
mehr nehmen kann, sondern eine Art degenerierten indexinternen
Querverweis. Aber das ist schon laengst die Ebene von MS-Word,
andere Programme machen da eher keinen Index, RTF-Faehigkeiten
hin oder her. Die urspruengliche Frage war aber, "was kann man
tun" und nicht "wie bediene ich MS-Word mit Daten"


>>> Als mögliche Alternativen als Exportformat sehe ich:
>>> LaTeX: das wird aber auch nicht einfacher und ohne TeX-Installation 
>>> kann man mit dem Ergebnis nicht viel anfangen.
>>> OpenDocument: kenne ich nicht genug, um das zu bewerten. Ich 
>>> bezweifele aber, dass es einfacher als RTF ist, da die 
>> Dokumentation 
>>> den dreifachen Umfang hat.
>> Och, dann gaebe es noch ISO DIS 29500 (Open OfficeXML).
> 
> Open Office XML ist die Microsoft Konkurrenz zu OpenDocument und kein ISO-Standard.
> Warum sollte man das nehmen?

Weil $Bills Minions es inzwischen geschafft haben, es zum ISO-
Standard zu adeln ;-)


>> Sagen wir mal so: Geht es um die Druckvorstufe, dann sollte 
>> man sowieso nicht Word nehmen sondern ein Satzsystem, da ist 
>> mir keines bekannt, das mit RTF umgehen koennte. Heraus kommt 
>> ein PDF als Input fuer den Belichter und evtl. eine Variante 
>> mit aktivierten Hyperlinks fuer den Dokumentenserver.
> 
> Und wie erstellen Sie die Druckvorstufe?
> Mein Weg wäre ein RTF-Export, der in Word eingelesen wird. Damit
> erstellt man Word-Dokumente, die dann mit dem Satzsystem
> weiterverarbeitet werden.

Wenn da sowieso noch ein Satzsystem kommt, kann ich es auch
in Notepad bearbeiten (o.k., Word kann bessser suchen und
ersetzen, aber auf Formatierungen kommt es dann ja wohl nicht
wirklich an)


> Oder man exportiert in LaTeX...

Was ein Beispiel fuer ein Satzsystem waere.


>> Es bleiben als Anwendung fuer den Export in Office-Formate 
>> eigentlich nur rohformatierte Listen zur internen 
>> Weiterverarbeitung in der Textverarbeitung oder 
>> Tabellenkalkulation. Und hier ist leider schwer zu 
>> entscheiden, ob ein Anwender eine moeglichst reich 
>> formatierte Liste wuenscht oder eben nicht, weil er massives 
>> Umformatieren mit eigenen Makros und Formatvorlagen 
>> (beherrscht und) beabsichtigt.
> 
> Das kommt mir wie der falsche Weg vor, die Daten zu Listen zu
> reduzieren. Dafür ist doch die Exportsprache da, alles so weit
> vorzubereiten dass bei der Nachbearbeitung nicht mehr programmiert
> werden muss.

Evtl. reden wir hier leicht aneinander vorbei: Mit "Listen" meinte
ich im Gegensatz zur "Druckvorstufe" etwas, was noch geeignet
nachbearbeitet wird oder zumindest werden koennte. Das kann
durchaus eine aufwendige Mini-Bibliographie sein oder eine
"Neuerwerbungsliste" zum Veroeffentlichen auf der Homepage.



>> Die neueren Textverarbeitungen 
>> beherrschen alle den Import beliebiger HTML-Dateien (je 
>> weniger fehlerhaft der HTML-Code, um so zuverlaessiger), ich 
>> habe leider keine Erfahrungswerte, ob dies nicht schon 
>> laengst als hinreichender Ersatz fuer den Import von 
>> RTF-Dateien taugt.
> 
> Mein Eindruck ist, dass ich auf diese Weise vielleicht
> Inhaltsverzeichnisse, aber nicht ohne weiteres Registereinträge erzeugen
> kann (außer ich produziere irgendwelche Spezialeinträge, die ich dann
> mit eine globalen Ersetzung in dem Programm der Wahl umwandle). Auch
> Fußnoten kommen mir nicht einfach vor.

HTML hat ein Fussnoten-Element und es wuerde mich nicht wundern, wenn
Textvearbeitungen es erkennen und in - Fussnoten! umwandeln. Im
Datenbank- oder bibliographischen Kontext hingegen sind mir Fussnoten
eigentlich noch nicht aufgefallen.


>> Speziell RTF ist uebrigens ein fuer unsere Zwecke a priori 
>> wenig geeignetes Werkzeug: Dokumente sind ausschliesslich 
>> durch Sections und Absaetze strukturiert (insbesondere ist 
>> darueber hinaus nichts geschachtelt).
> 
> Ich weiß nicht, was Sie da benötigen. TeX kommt auch mit chapters und sections aus.

plus dem, was man in seinem Style-Dokument dann noch selbst
definiert.

>> Jegliche Formatierung 
>> erfolgt rein visuell, damit auch Dumpfbacken wie Wordpad es 
>> anzeigen koennen. Ist einem Absatz eine Formatvorlage 
>> zugeordnet (ein eher mickriger Ersatz fuer logische 
>> Strukturierung), dann muss ein RTF-Reader die tatsaechliche 
>> Formatierung des Absatzes mit der im Dokument hinterlegten 
>> Standardformatierung der Vorlage vergleichen, um die 
>> individuell abweichende Formatierung des Konkreten Absatzes 
>> zu ermitteln, und diese dann mit der aktuellen (aus einer 
>> nutzerspezifisch geladenen, externen Formatvorlage) verbinden 
>> fuer die konkrete Formatierung.
> 
> Erstens sehe ich nicht, warum man mit geeigneter Definition von
> Formatvorlagen nicht die gewünschten logische Strukturen abbilden kann.

Klar kann man das. Nur ist es bei RTF halt ein umstaendliches Extra,
was muehselig auf die nicht verzichtbare optische Formatierung
aufgestuelpt wird.


> Zweitens sollten bei RTF-Exporten den Abschnitten normalerweise das
> Standardformat der Formatvorlage zugeordnet werden, ich kann mir nur
> wenige Ausnahmen vorstellen, wo einzelne Teil-Elemente eine
> individuelle Auszeichnung bekommen.

Na, wenn Sie doch nur den Standardabsatz benutzen, dann geht es auch
in Notepad.

Bei Bibliographien etc. wird aus dem Feld- (und Satz-) Reichtum
der Datenbank Text erzeugt, der wie auch anderer Text in Ueberschriften
und Absaetze gegliedert ist (sowohl als ganzes als auch auf einen
einzelnen Datensatz/Eintrag bezogen betrachtet). Jeder dieser
Absaetze hat (man denke an die ISBD) aber fuer sich eine eigene
Bedeutung (Haupteintrag, Signatur, Fussnoten, Schlagworte) die
sich zur optisch unterschiedlichen Behandlung anbietet. Und viele
Absaetze haben auch noch eine Binnenstruktur (etwa einleitende
Wendungen) die moeglichst ansprechend zu formatieren ist.

Die RTF-Exporte von HANS kennen dementsprechend knapp 60 verschiedene
Absatzformate, die basieren natuerlich fast alle auf dem Standard-
Absatzformat und sind ansonsten auch nicht recht verschieden. Sie
geben dem Anwender aber die Moeglichkeit, gezielt ueber eine eigene
.dot-Datei Eingriffe vorzunehmen, und sei es nur das Ausblenden
gewisser Information.



>> Demgegenueber stehen in 
>> unserem Fall dann Inhalte, die aus Datenbanken kommen, also 
>> hochgradig strukturiert sind und wenig optische 
>> Individualitaet enthalten oder verlangen.
> 
> Das ist doch gerade das Exportproblem, dass man diese Art von Daten
> irgendwie auf Papier bringen will (sonst würde ich auch XML nehmen). Und
> ihnen dafür visuelle Unterschiede zuordnen muss (von mir aus auch
> 'optische Individualität').

Das eine ist die Verdichtung von Daten zu Text (s.o.), das andere
die konkrete visuelle Formatierung.

Im Allegro-Kontext bedeutet das, dass ich mit einem DOS-Editor in
einer Parameterdatei irgendwelche 144tel-inch genaue Werte an mindestens
zwei Stellen kohaerent eintragen muss, um minimale Aenderungen
hinzubekommen. Dabei gibt es spezialisierte Programme (etwa MS Word ;-),
die das auch mit einem graphischen Interface bewerkstelligen: Einfach
mit der Maus dran rumrupfen, schon ist die Tabelle anders dimensioniert.

Mit einem Bruchteil der Arbeit bekomme ich visuell dasselbe hin,
wenn ich HTML exportiere mit reichhaltigen class-Attributen und
entsprechenden externen CSS-Styles (die ich naemlich gar nicht durch
allegro durchwursten muss). Da scheint mir doch die Arbeitsteilung
zwischen Experten fuer Textverdichtung und logische Struktur (Datenbank)
und Visualisierung (Styling) wesentlich eleganter geregelt.


viele Gruesse
Thomas Berger
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.3-nr1 (Windows XP)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iQCVAwUBSQCNOWITJZieluOzAQKZRAP/fEOKjwnTv7bbfooiHjT6Hefo2lnNY9tu
JUja6nz89PLJSHrYufQw25uSr7e22i7xN8ct+XH6jwKH539JLtOqTQhyWF9DFZYo
bDf7cyim42UhEj3cQzH9cu/B2FMEim0wM9k5RAn9cdwN3FfGiCoUHxpGr55l8QbE
ArUmRZKJav8=
=EELV
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro