AW: AW: AW: [Allegro] Umkodierung

Thomas Fischer fischer at sub.uni-goettingen.de
Do Feb 26 16:28:59 CET 2009


Hallo Herr Eversberg,

> Sie sind also sicher, daß bei acon der Text in ANSI-Codes 
> ankommt? (D.h. die HTML-Seite, von der die Daten abgeschickt werden, ist 
> ANSI-codiert)

Nein, ist sie normalerweise nicht, sie wird aber vor der Weiterverarbeitung von UTF-8 soweit wie möglich nach ISO-Latin-1 kodiert, was jenseits von 255 liegt bleibt, als &#nnn; erhalten.

> Und in dem Job wird weder
> set U1 oder set U2 
> noch switch coding 0
> (1 ist default) angewendet.

Nein, wird nicht, ich hatte den Job ja am Dienstag mitgeschickt.

> Der Befehl  insert #...  codiert mit Hilfe der o.apt um.
> Es sei denn, Sie setzen vorher
> switch coding 0       (denn 1 ist default)
> Schon versucht?

Wie im Job gezeigt benutze ich put, um den ganzen Datensatz zu speichern.

> Die Codes der typographischen Anführungszeichen sind in 
> OstWest ja alle ersetzt durch andere Zeichen. Diese stehen 
> wohl bei Ihnen in den Daten:
> 
> unten links     in der o-Tabelle werden sie dann so zugeordnet:
>   130 einfach      014    d.h. so kommen sie in der Datenbank an.
>   132 doppelt      017
> oben rechts
>   145 einfach      182
>   147 doppelt      235
> 
> (Die eineindeutige o-Tabelle arbeitet dann ja von rechts nach links)

Wie erwähnt benutzen wird den OSTWEST-Font nicht (aus historischen Gründen, weil nicht Internet-kompatibel).
Ich möchte aber fragen, ob ich die eigentlich eineindeutige o-Tabelle etwas missbrauchen kann, um mehrere Zeichen auf dasselbe Zeichen abzubilden. Was passiert, wenn auf der linken oder rechten Seite der Tabelle ein Wert mehrfach vorkommt?

In der o.apt sind ja auch einige Nicht-Eindeutigkeiten enthalten:
o .185 127   grafik
o .186 127   ...
o .187 127   ...
o .188 127   ...
...
o .204 127   ...
o .205 127   ...
o .206 127   ...

Heißt das, dass ANSI(127) auf ASCII(206) abgebildet und umgekehrt alle ASCII-Werte links auf ANSI(127) geworfen werden?
Mein Ziel wäre, ", “, “ und „ alle auf " abzubilden, und für die Rückrichtung nur " zu verwenden.

Als Alternative sähe ich nur, die Zeichen unverändert zu lassen und sie für die Anzeige entsprechend umzuwandeln, das wäre bei der Bearbeitung aber etwas irritierend.

Mit freundlichen Grüßen
Thomas Fischer 




Mehr Informationen über die Mailingliste Allegro