<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
          "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html  xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en"><head>
<title></title>
<meta http-equiv="content-type" content="text/html;charset=utf-8"/>
<meta http-equiv="Content-Style-Type" content="text/css"/>
</head>
<body>
<div align="left"><font face="Arial"><span style="font-size:12pt">Ich beklagte mich:</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt">> > Er wandelt UTF-8-Codes nicht in Entitätencodes um, macht z.B. aus dem </span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt">> > 3-bytigen UTF-8-Code E4BAAC nicht \u20140?</span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">und Herr Eversberg antwortete:</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt">> Das Programm  index.exe  macht das nicht, die anderen schon!</span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt">> </span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt">> Nun, wir hatten einfach nicht gedacht, daß jemand auch im Index</span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt">> Entitätenzahlen haben will! Davon war nicht die Rede gewesen!</span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Zugegebenermaßen hatte ich in dem Augenblick, als ich den Entwickler um den Einbau der Umrechnung 
"UTF-8 --> Entitätenzahl" bat, die Situation noch garnicht vor Augen, vor der ich jetzt stehe:</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Ich habe eine Allegro-Datenbank mit chinesischen Zeichen, die konsequent (ab Entitätencode 128) utf-8-
codiert ist. Nachdem es mir gelungen ist, auch die chinesischen Textelemente im Formular bearbeitbar zu 
machen (eine der Voraussetzungen dafür bildet die Umrechnung "UTF-8 --> Entität"), möchte ich nun 
auch die chinesischen Zeichen im Index erscheinen lassen:</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Dazu müssen sie von UTF-8 in eine Codierung konvertiert werden, die der "regierende Font" korrekt zu 
interpretieren vermag (ich benutze erst einmal den Code GB2312).</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Wie bei der Formularbearbeitung sind dafür 2 Konvertierungsschritte erforderlich:</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Erstens: Auflösung der UTF-8-Codierung in Entitätendarstellung, also z.B. Umwandlung von E4BAAC in 
&#20140; </span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Zweitens: Ersetzung von Entitätenverschlüsselung durch vom Font korrekt interpretierbare Codesequenz, 
mittels Sequenzersetzung; Vorliegen eines korrespondierenden SD-Datensatzes mit geeigneter 
Indexierung ist Voraussetzung (siehe Verlautbarung 164); um beim Beispiel zu bleiben: &#20140; wird in 
diesem Schritt durch (hexadez.) B1B1 (GB2312-Code für den dez. Unicode 20140) - im 
Ersetzungsregister (standardgemäß Reg. 10).</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Und der erste dieser beiden Schritte wurde von index.exe gestern nicht geleistet:</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"> </span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt">> Aber ok, es wurde schnell mal eben eingebaut. index.exe liegt bereit.</span></font></div>
<div align="left"><font face="Arial" color="#7f0000"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Danke - aber die neue index.exe macht es auch noch nicht, gibt das gleiche Ergebnis wie die gestrige! :-((</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Mit besten Grüßen von</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Heinrich Allers</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt"><br />
</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">allers@t-online.de * http://www.h-allers.de</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Netztagebuch: http://heinrich-erlo-ger.blogspot.com/</span></font></div>
<div align="left"><font face="Arial"><span style="font-size:12pt">Bitácora: http://heinrich-erlo-spa.blogspot.com/</span></font></div>
<div align="left"></div>
</body>
</html>