[Allegro] import und acon erneuert

Thomas Berger ThB at Gymel.com
Mo Feb 1 09:02:53 CET 2010


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg,

>> Ich habe daraufhin die Schrauben noch etwas angezogen und das
>> Unicode-Zeichen
>>
>> 1F02A;MAHJONG TILE JOKER;So;0;ON;;;;;N;;;;;
>>
>> in den UTF-8-Eingangstext hineincodiert (vgl. <
>> http://www.unicode.org/charts/PDF/U1F000.pdf >, die Bytesequenz in
>> UTF-8 ist
>> F0 9F 80 AA). Am Ende herauskommen muesste damit 🀪
>>
>> import16 hingegen liefert ߀
>> und import32 liefert 𐟀   (= 65536+1984)
>>
>> D.h. irgendwo ist noch eine Macke in der Codeumrechnung 
> 
> Nein, das Programm ist mit 4stelligen UTF-Codes schlicht überfordert.

Also ja...


> Da müßten wir erst, sollte das ein echtes Desiderat sein, beim
> Unicode-Konsortium vorstellig werden und uns den (hoffentlich
> kostenlos nutzbaren) Umrechnungsalgorithmus besorgen und mal schauen,
> ob wir's damit hinkriegen.

Wenn die Programme UTF-8-Sequenzen in numerische Entitaeten umbauen,
dann sollten sie das auch korrekt tun. Wenn dafuer erst ein Desiderat
formuliert werden muss, sei das hiermit geschehen.

Die Spezifikation der "UTF-8 encoding form" finden Sie im Haupttext des
aktuellen Unicode-Standards <
http://www.unicode.org/versions/Unicode5.2.0/ch03.pdf > ab p. 92 unten
bis p. 95 unten: Es geht dort hauptsaechlich um die Behandlung von
"ill-formed" UTF-8, die - unter Hinweis auf Sicherheitsprobleme, die
andernfalls entstehen koennen - ebenfalls normiert wird.

viele Gruesse
Thomas Berger



-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (Cygwin)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iJwEAQECAAYFAktmiq0ACgkQYhMlmJ6W47NmfAQAqmRhCR8CQO5yFBVjRf5JmFgU
XPB5pc8Levs4NDeXGo5xLNed6sBaC5a5bxjzBsPg3cYCCGpQwHNbyp+fkcsNI4oV
XwgmvWjp1ACH8j0AC0ukqRcuuAsvGyk34KbC2RCndIVcAV2tl8Src14BzX6cS1vU
tss1FEuTJOBJrzpv014=
=ghi0
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro