[Allegro] import.exe und u-Umwandlungen

Di Nov 18 10:52:10 CET 2014

Lieber Herr Eversberg,

mit v33.5 (import.exe vom 18.11.2013) funktionierte es noch, ab v34.00
(import.exe vom 29.1.2014) gibt es folgendes Phaenomen:

Ein Fremddatensatz (< http://d-nb.info/gnd/129656909 >) enthaelt allerhand
"hohe" Unicode-Zeichen, nach einem Roh-Import erfolgt eine weitere Umwandlungs-
stufe mit import.exe (-ikat -etest/test.alg), bei der ich test.apr auf
folgendes reduzieren konnte:

zl=0        Zeilenlänge unbegrenzt (kein Umbruch)
ks=4        Beginn des Ausgabetextes beim ersten Zeichen
ke=0        Kategorie-Ende = Code 0
as=""       Aufnahme-Start: wird manuell gesetzt
ae=""       Aufnahme-Ende: wird manuell gesetzt

#t{s0}
##
#t{s4}
#t{C C}
#+#

u 000
u 194 136 170

Die u-Zeile setzt den Export in den Modus, alle nicht ueber die u-Zeilen
abbildbaren UTF-8-Zeichen in die Parameterentitaeten &#nnn; um.

Beim in test.apr enthaltenen Pauschalexport mit den V34er-import.exe's
ist nun der Datensatz verkuerzt, das letzte exportierte Feld dabei
abgeschnitten (das fragliche Feld mit den japanischen Zeichen ist weiter
vorne und wird exportiert). Es faellt dabei auf, dass die abgeschnittene
Ausgabe im Vergleich zur "1:1-Version" (u-Zeile deaktiviert) in etwa gleich
lang ist (die Differenz ist 4 Bytes).

Kann es also sein, dass ein interner Pointer fuer das Datensatzende
von import.exe nicht angepasst wird, wenn die Ausfuehrung der UTF-8
Umwandlung in Parameterentitaeten zu einer Verlaengerung des Satzes
fuehrt?

viele Gruesse
Thomas Berger