[Allegro] Neue Zeichensatz-Tabelle

Thomas Berger ThB at Gymel.com
Mo Feb 11 11:00:29 CET 2008


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg,


| Oft wird anscheinend einfach ein Apostroph dafür gesetzt. Das ist dann
| akzeptabel, wenn man nicht, wie in Katalogen, mit einer Vielzahl von
| Sprachen umzugehen und sie transliteratorisch unter einen Hut zu bringen
| hat. Ein Hamzah haben die Hebräer aber, soweit ich sehe nicht.
| Und Windows-OstWest, anders als Berger anscheinend ohne Beleg meint,
| auch nicht. (Die 158, die er in seiner Dokumentation anführt, ist
| in Win-1252 unbelegt und schwer verwendbar - wie 127 und 141-143.)

Mir war wohl entgangen, dass folgender Text inzwischen revidiert wurde:

http://www.allegro-c.de/news/acn981/acn981.htm

Es ist wohl allerdings so, dass es sich um eine Zeichenposition
handelt, die irgendwie erst nachtraeglich in CP1252 hereingekommen
ist (sie *war* einmal unbelegt, ist es aber seit irgendeinem Update
in den spaeten 90er-Jahren nicht mehr) und daher wohl durch das
Betriebssystem emuliert wird, egal was der konkrete Font sagt. Insofern
wird bei Zeichen 158 zwar meist z-hacek gezeigt, das ist in Ostwest aber
mitnichten gemeint (dort ist es Zeichen 190).


| Es scheint daher richtig, den Code für Ain im Angebot zu belassen, aber
| mit dem Einverständnis, daß er nichts mit dem Arabischen zu tun hat und
| dafür keine Verwendung findet. Apostroph für das Ain wäre auch fast
| akzeptabel, wenn es beim Indexieren schadlos weggelassen werden kann
| (anders als beim Arabischen). Deshalb hatte ich gefragt, wie es denn
| indexiert wird. Im IxTheo fällt es weg, wie ich jetzt sehe. In unserer
| i.apt ebenfalls. Ich kann nur vermuten, daß dies der Auffindbarkeit
| von Wörtern weitaus weniger schadet als im Arabischen das Weglassen
| der Akzente beim Indexieren und der Vokale beim Transliterieren.
| Zu letzterem können wir ja nun datentechnisch wirklich nichts
| beitragen.
| Die gegenwärtige LC/ALA-Tabelle ordnet dem hebr. Ain den Unicode
| 02BF zu, und das machen wir jetzt auch.

Das haben Sie schon seit 2003 so gemacht:

http://www.allegro-c.de/unicode/zcodes.htm

"639" ist also evtl. nur ein fortgeschriebenes Relikt aus Zeiten vor
2003.

Es ist aber so, dass das Mapping auf 02BF in MARC seit vielen Jahren
NICHT mehr gueltig ist, sondern das zum (unspezifischeren) 02BB
(vgl. < http://lcweb2.loc.gov/diglib/codetables/45.html >.

Die Aenderung erfolgte bereits 1999, vgl. den (fortgeschriebenen
Text) < http://www.loc.gov/marc/marbi/1996/96-10.html > und die
Diskussion in < http://www.loc.gov/marc/marbi/2005/2005-05.html > zu den
Gruenden.

Dieses ANSEL-Mapping war nach meiner Erinnerung dann auch der wichtigste
Grund dafuer, dass das spaeter entstandene Unicode-Mapping von ISO 5426
ebenfalls dieses Mapping gewaehlt hat.

viele Gruesse
Thomas Berger

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.3-nr1 (Windows XP)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iQCVAwUBR7AcvWITJZieluOzAQIdKwP+OBk8ylyOazyCYR5KEvNLq8dSIpKfNljy
1suEWDJbIXcbj+213eoyrYHvjE1hh0l2i81XyTqmE4pBdfkENys8QuyVKpKskW00
hwFh+zuqz2flKz0Ho9/aV4udb3pRTUFcME4F9k/5ibM96P5tGjf+b4AOhU6VQrUT
EI7ZsOx6dFc=
=l0lD
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro