AW: [Allegro] japan./chines. Fremdsprachen: Konkordanz vonaltenTSR-Programmen?

Mo Apr 28 13:20:33 CEST 2008

Guten Tag Herr Kaun,

danke für Ihre Optimismus, den hatte ich auch schon paarmal, und bei
jeder neuen Windung kehrte er sich in pessimismus um...
ich notiere mal meine gedanken dazu...

On Mon, 28 Apr 2008 13:21:39 +0200, Kaun, Matthias wrote:
<cit>es sollte moeglich sein, sowohl die jap. als auch chin. datenbank
nach UTF-8 zu konvertieren. Alle Zeichen der ostasiatschen nationalen
Standards sind in UTF-8 abgebildet. Probleme werden wohl nur die
Zeichen mit einem Acii-Wert ueber 127 haben (deutsche Umlauts und
andere Zeichen), denn bis dahin sind die Zeichen ja auch eins zu eins
in UTF-8 abgebildet.

ja, da sehe ich keine probleme. (mit der 1500-seitigen doku zu unicode
im rücken).
NUR: was codiere ich da? Ich kann derzeit den vorliegenden datensatz
nicht interpretieren. es fehlt die konkordanz. ich habe keine ahnung,
was die ******ten tsr.programme IN die datensätze reinschreiben.

<cit>
<cit>In der Regel finden Sie westliche Schrift und die
2-Byte-Kodierungen, aber das ist kein Problem (s. o.). 
<cit>
<cit>Im Prinzip kann man die Datenbanken auch mit a99 verfuegbar
machen, aber leider nur im Prinzip! Dann benoetigen Sie aber einen
front-end-processor, der Ihnen die 2-Byte-Kodierung auch wieder so
darstellt und Ihnen kein Ascii-Muell angezeigt wird (z.B. NJStar).

mit den gebietsschemata-leisten unter wxp habe ich ganz winzige erfolge
gehabt: es wurde sogar einmal abgespeichelt, war sogar aufrufbar. und
es war sichtbar: IM linken fenster, in der echten datensatzbelegung.
natürlich nicht im großen rechten fenster (von a99), da wütet ja eine
ascii-ansi-umcodierung auf basis westlicher intelligenz....

<cit>
<cit>Wenn Sie die Datenbanken nach UTF-8 konvertieren moechten, gibt es
mehrere Moeglichkeiten (php-Skripte oder aber ein Script von Ken Lunde,
adobe, das noch immer seinen Dienst tut: 
<cit>ftp://ftp.ora.com/pub/examples/nutshell/ujip/perl/cjkvconv.pl
danke für diese interessante "bibliothek". ich werd das skrip mal über
die datensätze jagen....
mal schauen, welches wild dabei herausschaut....

<cit>
<cit>
<cit>Man muss hierbei auf die Zeichen ueber Ascii 127, die nicht
ostasiatische sind aufpassen.
<cit>Beim Versuch presto und die CJK-Programme unter Windows2x laufen
zu lassen, sind wir gescheitert; Es gibt aber Kollegen, denen das
gelungen ist.
was sind das für programme?
vergleichbar mit den gebietsschemata?

egal, ich muss erstmal das problem mit den altdaten lösen....

danke für die ansätze
ihr klaus lehmann