[Allegro] a99.exe vom 7.3.2013 (im einsatz für allegro-utf8) versus a99.exe vom 10.12.2014 -> 2 fehler

Klaus Lehmann lehmann_klaus at t-online.de
Do Jan 22 01:08:11 CET 2015


 
Guten Abend Herr Eversberg,
danke für Ihre Nachricht.
Am Montag, 19. Januar 2015 um 13:59 schrieben Sie.

leider komme ich jetzt erst um mitternacht dazu....

> Am 19.01.2015 09:53, schrieb Klaus Lehmann:
>>> ist nachfolgende aussage RICHTIG?
>>> das alte a99.exe vom 7.3.2013 würde $ oder "\031" nicht verstehen!
> Ja.
danke. dann brauche ich nicht in die richtung vorzuarbeiten!
zuest eine funktionierende a99.exe, dann die angleichung der api und 
apr.


> Aus Ihrem blauen Bild meine ich zu erkennen, daß die gespeicherten Daten
> nicht nur um zwei falsche Byte ergänzt wurden, sondern daß die anderen
> Bytes (also die von ni und hao) ebenfalls verfälscht wurden. oder sind
> es 3byte-Codes, die ni bzw. hao bedeuten?
> Könnten Sie mal übermitteln, welche UTF-Codes (hex oder dez) hinter ni
> und hao stecken? Vielleicht kriege ich damit wenigstens eine Erleuchtung
> oder einen Test hin.
> B.E.

http://allegronet.de/nihao-1.jpg
und

http://allegronet.de/utf8_199.ald
die chin.inhalte (codiert mit gb18030) befinden sich alle in 
subfeldern, die mit c anfangen. hier kann man mal nach 
"Keller_Aufsatz" suchen, sieht danach 31subfeldc mit den typischen 
zeichen für ni hao. schaut man sich den inhalt dieser datei unter 
linux an. hat man keine probleme.
in http://allegronet.de/nihao-1.jpg sieht man bei 1. den großen 
kringel: das ist die korrekte feldansicht, wenn man den richtigen 
zeichncode eingestellt hat. glücklicherweise ist nihao in simplified 
UND traditionell GLEICH!
nochwas: die beiden zeichen beim 1. kringel sieht man auch bei der 
alten 199.exe-version (2013).

sieht man sich den 2. kringel man den kringel, wie er über dem 
subfield-c liegt(=#40 subfieldc),und das drei chin. zeichen insgesamt wohl 
ersichtlich sind. am datensatz hat sich aber nICHTS geändert!
das dritte zeichen ist wohl nicht mehr chinesisch, sondern japanisch:
 
katagana letter so ODER halfwidth katagana letter so
dec 12477 hex u+305d    dec 65407  hex u+ff7f


in der allegro-datenbank ist aber nachwievor eingespeichert:
e4 bd a0 e5 a5 bd
in GB-18030 steht das für ni hao (=2 zeichen)
löst man den hexcode auf, erhält man unicode decimal 20320 (das 
zeichen für ni)
löst man den nächsten hexcode auf: e5 a5 bd, bekommt an  unicode 
decimal 22909, dass zeichen für hao

also nochmal: In der datenbank steht: e4 bd a0 e5 a5 bd
a99.exe interpretiert es "etwas" anders, und macht 3 zeichen draus!

drei beispieldatensätze bekommt man hier:
http://allegronet.de/utf8_199.ald



hilft das weiter?
danke und spätmitternächtlichen gruß
ihr klaus lehmann



-- 
Mit freundlichen Grüßen,
Ihr Klaus Lehmann
http://allegronet.de * eMail: allegronet at t-online.de * phone: 03528-452 807(fax 809) * mobil: 0171-953 7843
allegronet.de * Klaus Lehmann * D-01454 Radeberg * Bahnhofstr. 1
zuständiges Finanzamt: FA Hoyerswerda; zuständige Kammer: IHK Dresden;
zuständige Aufsichtsbehörde: Gewerbeamt Radeberg; USt-IdNr: DE247550760
* Software für zufriedene Bibliothekare: 1000x bewaehrt und ergiebig
* Bereits 4x allegro-utf8. Buchen Sie die allegro-Roadshow. Yes we can!
* Internetkataloge & WebHosting für Allegro-C & Web 2.0 mit VuFind
* 2011: Sponsor der Peter-Sodann-Bibliothek (Staucha)
* 2012: mit allegro-utf8 V3 und allegro-vufind auf der IFLA in Helsinki
* 2013: Bolero 64bit. Fußige Noten aufgeblättert (=Die Fußnotendoku)
* 2014: allegro-zdb: endlich. Die Wiedervereinigung! + eBooks
* 2015: allegro-vufind. Endlich! Noch moderner! Web2 auch für Ihren Katalog?





Am Montag, 19. Januar 2015 um 13:59 schrieben Sie:
> Am 19.01.2015 09:53, schrieb Klaus Lehmann:
>>
>>> ist nachfolgende aussage RICHTIG?
>>> das alte a99.exe vom 7.3.2013 würde $ oder "\031" nicht verstehen!
>>
> Ja.

> Aus Ihrem blauen Bild meine ich zu erkennen, daß die gespeicherten Daten
> nicht nur um zwei falsche Byte ergänzt wurden, sondern daß die anderen
> Bytes (also die von ni und hao) ebenfalls verfälscht wurden. oder sind
> es 3byte-Codes, die ni bzw. hao bedeuten?
> Könnten Sie mal übermitteln, welche UTF-Codes (hex oder dez) hinter ni
> und hao stecken? Vielleicht kriege ich damit wenigstens eine Erleuchtung
> oder einen Test hin.
> B.E.




Mehr Informationen über die Mailingliste Allegro