[Allegro] Änderungen im OSTWEST-Zeichensatz?

Thomas Berger ThB at Gymel.com
Mi Apr 21 09:45:13 CEST 2010


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg, liebe Liste,

> Aber mal nebenbei eine andere Frage: In den von der DNB freigegebenen
> Normdaten bemerke ich neben UTF-8 auch Codierungen dieser Art:
> 
> a\u0308   für ä
> e\u0301   für é
> 
> usw. Wobei 308 der Unicode für das Trema und 301 für das Akut ist.
> Sowas schon mal gesehen? Sieht ja eher nach RTF aus, aber dann
> immer noch eigenwillig, weil es die kombinierten Zeichen ja gibt,
> und was hätte RTF in XML zu suchen - wobei die Datei wiederum kein
> richtiges XML ist.

a+Trema waere ja die Normalform (eine der moeglichen), ist ein einem
gewissen Sinn also korrekter als das kombinierte Zeichen.

Je nachdem, ob die Daten ueber Verarbeitungsschritte geschleift werden,
die fuer MAB oder MARC gedacht sind, "gibt" es intern die kombinierten
Zeichen auch gar nicht. Ich vermute sogar, dass trotz "Unicode"-Umstellung
die interne Datenhaltung in PICA-Systemen noch weitgehend die
bibliothekarischen Zeichensaetze reflektiert und daher fast alle
Zeichen dekomponiert.

Jedenfalls ist \u0301 die JavaScript-Notation fuer Unicode-Zeichen und
in xy-2.0-Kreisen recht beliebt. Fragt sich allerdings, warum ueberhaupt
noch UTF-8-codierte Zeichen vorkommen und nicht alles in 7bit-ASCII
codiert ist.

viele Gruesse
Thomas Berger
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (Cygwin)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iJwEAQECAAYFAkvOrQkACgkQYhMlmJ6W47MrTQQAqZlTVWf9Uiy6RrHrhn5X0KEa
NOuBJwTYrKxRrqGGSbvPmeKtBsjtKGkcPPSNoYpd6jbpJupxj10MOk/rRzq2jVSN
u1lTIbzr18nbrRiBVnN6X0iNKxT9qxkVj4XMYAEyBUziXBh7fTsgPB8mAi7b+mL8
PJObvyu6oVcGdoPtl+Q=
=7j5c
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro