[Allegro] Fehlverhalten von y4 in Indexpar.-D.

Heinrich Allers allers at t-online.de
Do Apr 2 12:22:43 CEST 2009


Ich beklagte mich:

> > Er wandelt UTF-8-Codes nicht in Entitätencodes um, macht z.B. aus dem 
> > 3-bytigen UTF-8-Code E4BAAC nicht \u20140?

und Herr Eversberg antwortete:

> Das Programm  index.exe  macht das nicht, die anderen schon!
> 
> Nun, wir hatten einfach nicht gedacht, daß jemand auch im Index
> Entitätenzahlen haben will! Davon war nicht die Rede gewesen!

Zugegebenermaßen hatte ich in dem Augenblick, als ich den Entwickler um den Einbau der Umrechnung 
"UTF-8 --> Entitätenzahl" bat, die Situation noch garnicht vor Augen, vor der ich jetzt stehe:

Ich habe eine Allegro-Datenbank mit chinesischen Zeichen, die konsequent (ab Entitätencode 128) utf-8-
codiert ist. Nachdem es mir gelungen ist, auch die chinesischen Textelemente im Formular bearbeitbar zu 
machen (eine der Voraussetzungen dafür bildet die Umrechnung "UTF-8 --> Entität"), möchte ich nun 
auch die chinesischen Zeichen im Index erscheinen lassen:

Dazu müssen sie von UTF-8 in eine Codierung konvertiert werden, die der "regierende Font" korrekt zu 
interpretieren vermag (ich benutze erst einmal den Code GB2312).

Wie bei der Formularbearbeitung sind dafür 2 Konvertierungsschritte erforderlich:

Erstens: Auflösung der UTF-8-Codierung in Entitätendarstellung, also z.B. Umwandlung von E4BAAC in 
京 

Zweitens: Ersetzung von Entitätenverschlüsselung durch vom Font korrekt interpretierbare Codesequenz, 
mittels Sequenzersetzung; Vorliegen eines korrespondierenden SD-Datensatzes mit geeigneter 
Indexierung ist Voraussetzung (siehe Verlautbarung 164); um beim Beispiel zu bleiben: 京 wird in 
diesem Schritt durch (hexadez.) B1B1 (GB2312-Code für den dez. Unicode 20140) - im 
Ersetzungsregister (standardgemäß Reg. 10).

Und der erste dieser beiden Schritte wurde von index.exe gestern nicht geleistet:
 
> Aber ok, es wurde schnell mal eben eingebaut. index.exe liegt bereit.

Danke - aber die neue index.exe macht es auch noch nicht, gibt das gleiche Ergebnis wie die gestrige! :-((


Mit besten Grüßen von

Heinrich Allers

allers at t-online.de * http://www.h-allers.de
Netztagebuch: http://heinrich-erlo-ger.blogspot.com/
Bitácora: http://heinrich-erlo-spa.blogspot.com/

-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20090402/a18ba1bc/attachment.html>


Mehr Informationen über die Mailingliste Allegro