AW: [Allegro] japan./chines. Fremdsprachen: Konkordanz vonaltenTSR-Programmen?

Kaun, Matthias Matthias.Kaun at sbb.spk-berlin.de
Mon Apr 28 14:46:03 CEST 2008


Hallo Herr Wolf, Hallo Herr Lehmann,
> 
> Das Problem sind, wie Herr Kaun beschrieben hat, die westlichen
> Sonderzeichen.
> 
> Wir haben das gelöst, indem bei der Dateneingabe bei allen chinesisch- bzw.
> japanisch-sprachlichen Zeichen in der Kategorie für die Sprache ein
> entsprechender Inhalt ('chi', 'jpn') gesetzt wird. In diesen so
> gekennzeichneten Datensätzen sind Umlaute und andere europäische
> Sonderzeichen nicht erlaubt. Wenn dort aber trotzdem solche Zeichen
> eingegeben werden sollen, müssen die BibliothekarInnen diese Sonderzeichen
> als SGML eingeben, sprich 'ä' wird zu 'ä' usw.
> 

Dass geht aber nur, wenn die Felder wirklich nur der Orignaischrift zugewiesen sind. Bei Parallelsachtitel, einheitssachtiteln oder auch Namen in anderen Schriften kann die eindeutigketi nicht immer gewaehrleistet sein, es sei denn, man hat sich bereits bei der Formatentwicklung darueber Gedanken gemacht.
Wir haben das hier mit Exporten geloest; alle westlichen Sonderzeichen/Umlauts werden als solche markiert und koennen dann nach der Konvertierung wieder in UTF-8 Werte aufegloest werden.
Da wir wissen, dass ostasiatische Zeichen immer aus zwei Byte bestehen, ist zu erwarten, dass die westlichen Sonderzeichen in der Naehe ein Wert unter Ascii 127 haben; diese Zeichen haben wir dann markiert, so dass diese bei dem eigentlichen Konvertierungsprozess unberuehrt bleiben.
Danach erfolgt die Konvertierung der gesetzten Zeichenkette nach UTF-8.

Schoenen Gruss
Matthias Kaun