AW: [Allegro] Re: <Alt>+m-Mechanismus nicht invariant gegen'fcharset...' in spchr.rtf?
Fischer, Thomas
fischer at sub.uni-goettingen.de
Mi Jun 5 10:55:38 CEST 2013
Lieber Herr Allers und Kollegen,
> > Es ist schon lange nicht mehr so, dass via Zwischenablage das nackte
> > Byte (was es ja oft gar nicht ist) entsprechend der Codierung des
> > Quellfensters speichert, die Codierung vergisst und dasselbe Byte
> > ohne Beruecksichtigung der eingestellten Codierung in das Zielfenster
> > kopiert. Und man kann natuerlich auch nicht erwarten, dass Windows
> > die Spezialitaeten des allegro-Windows-Zeichenatzes kennt, also dass
> > dort das "Û" wie ein "Ł" /aussieht/ und dann "entsprechend" agiert
> > (selbst wenn es das wuesste waere es falsch, denn die Zuordnung
> > sollte natuerlich die Bedeutung und nicht das Aussehen der Glyphen
> > beruecksichtigen, und die Bedeutung ist halt "Ù").
> >
> Richtig.
> Copy&Paste kann daher nur korrekt klappen, wenn Quelle und Ziel mit
> identischen Codes arbeiten, also auch mit Schriften, die die betr.
> Codes auf gleiche Weise abbilden.
meine These ist, dass hier ein Gemenge von Codepage, Zeichensatz und Unicode sichtbar wird.
Der Alt-m-Mechanismus entnimmt der Anzeige von spchr.rtf korrekt eine Code-Nummer *und* einen Zeichensatz, das sieht man z.B. wenn man nach Alt-m die Zwischenablage in WordPad kopiert: Dort wird das richtige Zeichen in dem voreingestellten Zeichensatz (z.B. allegro Letter Gothic) angezeigt. Wenn ich das als reinen Text kopiere (z.B. in Editor oder Notepad++) so geht der Zeichensatz verloren und es erscheint das Standardzeichen, das der Codenummer entspricht. Man kann dann in Editor den Zeichensatz auf "allegro Letter Gothic" setzen und bekommt so das Ł zurück. Da ich hier reinen Text schreibe, würde das hier auch als Ù dargestellt.
Das Problem ist, dass bei A99 sich das Anzeigefenster wie WordPad (mit Zeichensatz) und alle anderen Eingabemöglichkeiten wie Editor (ohne Zeichensatz) verhalten, warum das so ist, weiß wahrscheinlich Herr Eversberg.
Ich habe für meine Unicode-Datenbanken die Textbearbeitung im Anzeigefenster so eingestellt, dass die entsprechende Codepage bei der Umwandlung nach UTF-8 berücksichtigt wird, so etwas ginge natürlich im Prinzip auch bei spchr.rtf, allerdings hülfe das nicht, wenn die Datenbank das Unicode nicht verarbeiten kann.
Das alles klärt die Frage nach den Fragezeichen nicht. Meine Eindruck ist, dass Windows zusätzlich zu dem beschriebenen Kopiermechanismus von Code-Nummer und Zeichensatz noch zusätzlich Unicode für das entsprechenden Zeichen bereitstellt, natürlich nur für das dort vermutete Zeichen und nicht für die OSTWEST-Variante. Das wird zu benutzen versucht, wenn der Zeichensatz nicht eingestellt werden kann, und an dieser Stelle dann ein Fragezeichen ausgegeben, wenn Unicode auch nicht unterstützt wird. An dieser Stelle scheinen sich Editor und Notepad++ zu unterschieden, wenn die Kodierung von Notepad++ auf ANSI steht. Wenn ich in Herrn Allers' spchr.rtf "ř" auswähle (hier als Unicode eingegeben) so erhalte ich beim Kopieren in Editor und WordPad "ř" zurück, in Notepad++ "r" und in WinVi wie in A99 ein "?".
Das alles ist etwas spekulativ, aber vielleicht hilft es ja weiter in der Klärung des Sachverhaltes.
Mit freundlichen Grüßen
Thomas Fischer
Mehr Informationen über die Mailingliste Allegro