(Fwd) Re: Unicode-Unterstuetzung i.Vb.

Bernhard Eversberg ev at buch.biblio.etc.tu-bs.de
Mi Jan 15 12:39:29 CET 2003



Berger bohrt nochmals nach:

> Jedenfalls ist UTF-7 nicht etwas ueber &#N; herausgehendes, 
> sondern etwas fundamental anderes:
Na gut, dann sagen Sie, was wir statt dessen sagen sollten fuer das was wir 
meinen. Aber knapp, hoechstens 2 Woerter.

> Meinen Sie mit Unterprogramm etwas parametriertes
> #(X
> ...
> #)X
> 
> oder etwas festverdrahtetes wie bei IMPORT?
Letzteres. Ein schlichter, neuer Befehl. Auch als FLEX zu nutzen. Mit 
individueller Vorgabe derjenigen Zeichen, die vertauscht werden muessen mit dem 
nachfolgenden bzw. vorangehenden.

> 
> Sie werden merken, dass mit "Tabellen" beim Export nach UTF-8
> fast ueberall der Phrasenspeicher ueberlaufen wird, zumindest
> wenn Sie versuchen, die Zeichen zu kombinieren, die in 
> OSTWEST nicht kombiniert vorhanden sind.
> 
> Fremddaten der Zukunft werden viel mit XML zu tun haben, d.h.
> es werden nur UTF-8 und ISO 8859-1 relevant sein, jeder XML-
> Parser kann nach UTF-8 umwandeln (weil UTF-8 die einzige
> Zeichencodierung ist, die lt. Standard zwingend(!) beherrscht
> werden muss).
> 
Eine vollstaendige Unterstuetzung des einen wie des andern werden wir nicht 
hinkriegen koennen! Es kann sich nur um definierte Teilmengen handeln,
sonst laeuft immer irgendwas ueber oder die Effizienz geht gegen Null.
Wenn die Ansprueche deutlich darueber hinausgehen, wird man 
a) Importe bzw. Exporte durch vor- bzw. nachgeschaltete Programme oder Skripte    
   zusaetzlich behandeln muessen,
oder
b) migrieren muessen.

Insbesondere werden wir keine XML-Datenbank konstruieren. Sowas gibt's schon.

MfG B.E.



Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329, 
D-38023 Braunschweig, Germany
Tel.  +49 531 391-5026 , -5011 , FAX  -5836
e-mail  B.Eversberg at tu-bs.de  




Mehr Informationen über die Mailingliste Allegro