a99: Tip fuer Sonderzeichen

Allers Heinrich allers at goethe.de
Mi Nov 29 11:11:58 CET 2000


Kollege Eversberg schrieb zu diesem haarigen Thema:

> ...
> Ein Problem entsteht, wenn eine leere O.APT verwendet wird. Das ist
> typischerweise bei den Sinologen der Fall. Dann koennen die Codes 
> unterhalb 32 nicht verwendet werden. Wenn z.B. der Code 22 verwendet
> wird, und man legt ihn auf eine Phrase, dann erlebt man eine 
> Ueberraschung: Es reagiert so, als waere Strg+v gedrueckt worden, denn
> das entspricht dem Code 22 - es erscheint also der Text aus der
> Zwischenablage.

Stimmt, ich verwende bei meiner sinologischen Anwendung - siehe Baustelle
unter
http://buch.goethe.de/cgi-bin/acwww25/gkch.pl mit Umlauten!!  :-)) - den
Code 22 (an Stelle von 170) als Nichtsortierzeichen, und half mir nach
diesem Rezept:

> Abhilfe: die O.APT nicht ganz leer machen, sondern diese Zeilen drin
> lassen:
> 
> o .014 130
> o .015 131
> o .017 132
> o .018 137    
> o .019 134
> o .022 135    
> o .023 133    
> o .025 139
> o .028 159    

Bei mit bleibt die Umschlüsselung des Code 22 allerdings wirklich nur die
einzige Zeile in O.APT ist, weil ich die anderen Zeichen - außer dem hier
wohl nur aus Versehen fehlenden Code 31 (dazu weiter unten) - nicht brauche.

> Diese Codes liegen alle unter 160, was bei den Chinesisch-Systemen die
> kritische Grenze ist.

Hatte ich auch so gelernt, bis meine Kollegen im Goethe-Institut Peking bei
der Leserdatenerfassung (zur Vorbereitung der "alfa plus"-Ausleihe) heftig
die Nichteingebbarkeit bzw. Nichtdarstellbarkeit bestimmter Zeichen
beklagten: Es stellte sich heraus, daß bei der Kodierung dieser Zeichen mit
2 Bytes das erste der beiden Zeichen der Code 31 war! Bis dahin war Code 31
in O.APT auch umgeschlüsselt worden, und diese Umschlüsselung machte die
Darstellung der chinesischen Zeichen kaputt, bei deren Kodierung Code 31
beteiligt war.

Also nahm ich Code 31 aus O.APT heraus, konnte das Teilfeldtrennzeichen
danach aber nicht mehr eingeben - wollte aber auch nicht drauf verzichten! 

Die Lösung blieb übersichtlich, weil immer nur Teilfeld 'o' verwendet wird:

Ich legte auf eine Phrase die Zeichenfolge "tfotfo", eine Zeichenfolge, die
sicher nie vorkommt. Bei der flexgestützten Erfassung lasse ich an der
Stelle, wo "Teilfeldtrennzeichen+o" hinsoll, diese Phrase eingeben, und im
betreffenden Flex sorge ich im entscheidende Moment mit

...\_tfotfo_$o_\put...

($ steht hier für Teilfeldtrennzeichen-Code 31!) dafür, daß der Code 31 ins
Datenmaterial doch noch reinkommt. Ein nicht gerade durch Eleganz
gezeichneter Trick, aber er funktioniert!


Mit besten Grüßen:

Heinrich Allers

Goethe-Institut, Postfach 19 04 19, D-80604 München
Tel. ++89 / 15921 471; Telefax: ++89 / 15921 435
allers at goethe.de; http://home.t-online.de/home/allers
* Kulturen in Deutschland? Ja!
  Deutsche Leitkultur? Nein, Danke!




Mehr Informationen über die Mailingliste Allegro