Unicode Methode 2: UTF-8 intern

Bernhard Eversberg ev at buch.biblio.etc.tu-bs.de
Di Apr 29 09:01:48 CEST 2003


On 28 Apr 03, at 18:35, Thomas Berger wrote:

> > Nachteile:
> >   -- auch die deutschen Sonderbuchstaben muessen als 2-Byte-Codes
> >      verschluesselt werden
> 
> kennen MAB und MARC auch nicht anders.
Aber das Problem ist die Eingabe und Bearbeitung! Da will man keine obskure 
Verschluesselung sehen und eingeben, etwa ä oder schlimmeres, statt ä .

> >   -- Eingabe und Bearbeiten ALLER Sonderzeichen
> >      auch in a99 unkomfortabel. Anzeige und Indexierung korrekt.
> >      Nur mit Web-Formular (RuckZuck-avanti) könnte man ohne Probleme
> >      editieren.
> 
> Wenn Win'9x nicht waere. Denn unter NT, 2000 und XP muesste
> es die entsprechenden Eingabe und Listenfelder auch Unicode-
> Faehig geben.
Haben wir aber noch immer nicht rausgekriegt. Es geht um UTF-8! Man kann alles 
fuer Unicode kompilieren, aber dann muss man ueberall die 2-Byte-Original-
Unicodes verwenden, nicht UTF-8, und das ist nicht machbar.

> Genauere Betrachtung des Anzeigefelds ergibt uebrigens,
> dass man nicht unbedingt Font-Umschaltungen benoetigt, sondern
> unter XP etwa auch direkt die "Unicodes" eines Zeichens in
> RTF-Konvention
Auch in der Eingabe?

> > Es muss also eine Moeglichkeit geben, in der Exportsprache zu
> > sagen, welche 2- bzw. 3-Byte-Kombinationen ersetzt werden sollen
> > und durch was. (Kein ganz neues Desiderat.)
> 
> Stimmt. Und die Importsprache hat es in Ansaetzen seit
> immer schon realisiert.
Diese Ansaetze waren aber fuer den Fall UTF-8 nicht so brauchbar. Die Sequenzen-
Methodik, die wir fuer HTML4 gemacht haben, ist fuer UTF-8 ebenfalls nicht 
guenstig.

> > Die noetigen Listen (Dezimalcodes!) koennten mit unserem UTF-8-JavaScript-
> > Prograemmchen schnell erstellt werden.
> 
> Das ist ja auch ein Desiderat: Der Offizielle Code ist entweder
> dezimal oder vorzugsweise die vierstellige Hex-Ziffer fuer das
> Zeichen. So enthalten in allen offiziellen Tabellen. Dass man
> fuer die Nutzung in Allegro mit einem scheinbar obskuren
> Online-Prograemmchen die definitiv unuebliche UTF8-Notation ausrechnen
> muss und diese dann in den Parameterdateien eintragen, macht die
> Sache unnoetig kryptisch und erschwert die Akzeptanz.
Die Tabellen muessen ja nur einmal erstellt und dann nie wieder angefasst werden.
Die Diskussion hatten wir schon, durch Wiederholung werden die Argumente nicht 
besser und die Probleme nicht leichter.

> Im Licht des von Ihnen eben beschriebenen sehe ich nicht so
> recht, wo die Einschraenkung in der Nutzung der DOS-Programme
> liegen soll: Doch eigentlich nur darin, dass diejenigen Zeichen,
> die ueber OSTWEST hinausgehen, ueber einen geeignet zu definierenden
> Mechanismus (ewa: Eingabe des vierstelligen Hexadezimal-Unicodes :-)
> etwas umstaendlich eingegeben werden muessen

Nein, ALLE Sonderzeichen, auch die Umlaute! Und nicht nur um die Eingabe geht's, 
auch um die Bearbeitung, d.h. die Anzeige im DOS-Editor und im a99-Auswahl- und 
Schreibfeld.


Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329, 
D-38023 Braunschweig, Germany
Tel.  +49 531 391-5026 , -5011 , FAX  -5836
e-mail  B.Eversberg at tu-bs.de  




Mehr Informationen über die Mailingliste Allegro