[Allegro] import und acon erneuert
Bernhard Eversberg
ev at biblio.tu-bs.de
Do Jan 28 08:19:22 CET 2010
Thomas Berger schrieb:
>
> Im Test zufaellig auftretende Fremddaten enthalten in UTF-8 die Zeichen
>
> 0xdd (221) = ︠ (UFE20)
> MAB Name: Doppeltilde bzw. -bogen, 1. Teil
> Dezimal: 65056, UTF-8: 0xEF 0xB8 0xA0 = 239 184 160
> COMBINING LIGATURE LEFT HALF
> Kategorie: Mn = Mark, Non-Spacing
> Bidirektionalität: NSM = Non-Spacing Mark; Kombinationsklasse: 230 = Above
>
> und
>
> 0xde (222) = ︡ (UFE21)
> MAB Name: Doppelbogen 2. Teil
> Dezimal: 65057, UTF-8: 0xEF 0xB8 0xA1 = 239 184 161
> COMBINING LIGATURE RIGHT HALF
> Kategorie: Mn = Mark, Non-Spacing
> Bidirektionalität: NSM = Non-Spacing Mark; Kombinationsklasse: 230 = Above
>
> Import16 setzt diese (Import mit alg.aim, Export mit einer Parameterdatei, die
> ucodes.apt einbindet) inkorrekt um in
>
> &#';
>
> das 32-bit Import.exe hingegen konstruiert sauber ︠ und ︡
>
> Liegt der Unterschied daran, dass hier mit "signed integer" gearbeitet wird?
>
Vielleicht. Ich habe mal die eine solche Variable, die es in der Routine
gibt, auf "unsigned" gesetzt und index16 neu kompiliert. Liegt auf ftp.
Weniger diese, als vielmehr die "signed characters" haben immer wieder
extremen Ärger gemacht. Wir haben jetzt durchgängig im Compiler die
Option /J gesetzt, die alle characters auf unsigned setzt, integers
aber nicht. Die sind bei 32bit aber 4 Bytes groß, bei 16bit nur 2,
und daher kann's dann schon kommen, wenn sowas passiert.
Aber das nur nebenbei.
B.E.
Mehr Informationen über die Mailingliste Allegro