AW: AW: [Allegro] Umkodierung

Thomas Fischer fischer at sub.uni-goettingen.de
Do Feb 26 14:06:35 CET 2009


Hallo Herr Berger,

ich muss doch noch einmal nachfragen.
 
> Beim "put" passiert wie erwaehnt (und meines Wissens, bis zum 
> Beweis des Gegenteils ...) keine Konvertierung, durchaus wird 
> aber bereits konvertiert, wenn "gebe ... Daten an avanti" stattfindet.

Das verstehe ich nicht.
Ich schicke einen ANSI-kodierten Job an Avanti, wo soll da etwas kodiert werden (das passiert i einem einfachen Perlskript, kein PHP oder so).
Bei "put" werden bei die Daten aus dem Skript in die Datenbank geschrieben, dort kommt auf jeden Fall ASCII (DOS) an.
Aus meinen Skript

#19 mäßig, müßig,
#20 „Test“ noch ein ‚Test‘

kommt dort jetzt (in dere Anzeige von Classico)

#19 mäßig, müßig,
#20 äTestô noch ein éTestæ
  
heraus.

> Sowohl CP1252 als auch ISO 8859-1 werden "Latin 1" genannt, 
> avanti kennt keinen davon.

Wenn das geschieht, so ist das falsch. Wie der Name schon sagt, ist ISO 8859-1 ein internationaler Standard, der vom W3C als mögliche Kodierung von HTML akzeptiert wird. Der Windows-Zeichensatz CP1252 weicht an den Stellen 128 - 159 von diesem Zeichensatz ab, dort liegen u.a. die Zeichen, die mir Probleme bereiten.

> ...
> und das ist genau der Effekt, den die Standard-o-Tabelle, 
> also Umwandlung von DOS-Ostwest auf allegro-Windows hat.

Also wird doch eine Konvertierungstabelle benutzt! Aber welche? Und wann?
 
> Dass die Tabelle am Werk ist, ist wohl keine weitere 
> Ueberraschung, denn Sie erwarten ja bereits eine Konversion 
> von "ANSI" nach "ASCII", wenn ich sie recht verstanden habe.

Ich hatte Sie oben so verstanden, dass Sie sagen, dass keine Konvertierung stattfindet!?
 
> Fuer alles weitere muessen Sie sich zunaechst entscheiden, 
> welches "ASCII" Sie eigentlich in Ihrer Datenbank haben, und 
> welches "ANSI"
> das Ihrer Eingabedaten sein soll. Dementsprechend muessen Sie 
> dann eine o-Tabelle stricken oder (durchaus ein gangbarer 
> Weg) konsequent UTF-8-codierte Daten hineinschicken statt 
> unscharfem "ANSI".

Das alles ist ja längst passiert (vor etwa 10 Jahren): Extern (auf der Ebene der Perl-Skripte) wird Latin-1 (ISO/IEC 8859-1) benutzt, intern ASCII (CP437) (leider...), wie erwähnt kein OSTWEST. Jetzt kommt mir die Windows-Erweiterung CP1252 dazwischen und ich will wissen, in welcher Tabelle ich die Abbildung dieser zusätzlichen Zeichen einstellen kann.
Also konkret, ob an dieser Stelle p-, q- oder o-Transformationen eingesetzt werden und wie ich festlegen kann, welche Tabelle benutzt bzw. wo diese Tabelle gesucht wird.

Schön wäre auch eine Information dazu, wo ich Hinweise dazu in der Dokumentation finden kann.

Mit freundlichen Grüßen
Thomas Fischer 





Mehr Informationen über die Mailingliste Allegro