[Allegro] ucodes
Thomas Berger
ThB at Gymel.com
Do Jun 10 12:19:44 CEST 2010
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Lieber Herr Eversberg,
> Konkret, und konkret müssen wir nach all dem Wechseln allzuvieler Worte
> endlich werden, geht es, soweit ich sehe, um diese 7 Zeichen: (die jetzt
> teilweise zuvor mit 001 unwirksam gemacht werden)
>
> u 194 174 174 REGISTERED SIGN C2 AE; [00AE] -- ®
raus [d.h. die Zeile raus und das Zeichen als ® "stehen lassen",
nicht via "001" das Zeichen rauswerfen]
> u 202 185 039 MODIFIER LETTER PRIME 202 185 , CA B9; [02B9] -- ʹ
Transliteration des weichen Zeichens: Besser Apostroph als gar nichts.
> u 202 186 034 MODIFIER LETTER DOUBLE PRIME CA BA; [02BA] -- ʺ
Transliteration des harten Zeichens: lieber als ʺ stehen lassen,
die Anwender koennen es dann manuell herauswerfen, auf '"' oder "''"
umsetzen (m.W. sowieso ein eher unuebliches Zeichen)
> u 202 190 181 MODIFIER LETTER RIGHT HALF RING CA BE; [02BE] -- ʾ
allegro-Windows hat das Zeichen moeglicherweise auf Position 158, OSTWEST
kennt es allerdings nicht. Ich kenne mich mit arabischer Transliteration
nicht aus, mir scheint Apostroph (039) verantwortbar zu sein.
02BC, 02BE und 02C0 sollten m.E. unbedingt gleich behandelt werden.
ebenso sollten
02BB, 02BD, 02BF und 02C1 stets gleich behandelt werden
> u 204 147 039 COMBINING COMMA ABOVE CC 93; [0313] -- ̓
> u 204 156 215 COMBINING LEFT HALF RING BELOW CC 9C; [031C] -- ̜
> u 204 177 223 COMBINING MACRON BELOW CC B1; [0331] -- ̱
"combining" Zeichen koennen nur auf die 13 Akzentzeichen von Ostwest
abgebildet werden.
0313 koennte hinreichend haeufig einfach eine typographische Variante
des Hacek gemeint sein, wenn es aber wirklich das Psili sein sollte,
waere es nicht abbildbar (Laesst man ̓, koennen die Anwender
nachtraeglich analysieren, welchen Murks die Fremddaten enthielten und
das mit globalen Ersetzungen bereinigen)
031C ~koennte~ eine Fehlcodierung des Ogonek 0328 sein (wie erwaehnt
handelt es sich offiziell um ein IPA-Zeichen, gleichzeitig aber auch
um Cargo-Cult der bibliothekarischen Zeichensaetze weltweit)
0331 analog 0332 auf OSTWEST-223 abzubilden halte ich fuer legitim.
Generell sollte man mit dem "unwirksam machen" via Abbildung auf 001
extrem sparsam sein, und auch mit Brutalo-Mappings: ucodes.apt ist
nicht der Ort, um universelle Regeln aufzustellen, wie man jeglichen
Schrott aus Fremddaten "reparieren" kann, denn es gibt die kleine
Chance, dass die Zeichen gemeint sind, die da codiert sind...
viele Gruesse
Thomas Berger
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (Cygwin)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org
iJwEAQECAAYFAkwQvEAACgkQYhMlmJ6W47Pj3gP+OV7Iz96EeAGCAlCSLdLxiSdZ
Rpy95aRVYPDNdz8FzMylo6GTiiPv32M18zu1vVjCTqmJXeXG6KzF8Eo9UxHxJVLA
PzI9fdjLMmWWzV3NR1bRrErI2p0qX3qC3HkJprqN/LMLNZVJd2Xxb6cM783I7fXP
TaSdXkOT1qoNWy6xK3g=
=SDcB
-----END PGP SIGNATURE-----
Mehr Informationen über die Mailingliste Allegro