[Allegro] WG: allegro und fremdsprachliche Codierungen / Arial Unicode MS

Andreas Wolf Consulting info at andreaswolfconsulting.com
Mi Sep 28 17:16:21 CEST 2005



Hallo Herr Eversberg, liebe Liste,

ich teste eine ähnliche wie die von Herrn Eversberg beschriebene und in
Beirut eingesetzte Technik mittlerweile bei einer ganzen Reihe von mir
betreuten Bibliotheken und sie funktioniert wenn man untenstehende
Voraussetzungen beachtet auch mit mehreren fremdsprachlichen Codierungen
parallel. 

Im Einsatz habe ich z.B. chinesisch/koreanisch/japanisch im Museum
Rietberg in Zürich oder die Kombination russisch (Schreibweise links
nach rechts)/hebräisch (Schreibweise links nach rechts) im Moses
Mendelssohn Zentrum in Halberstadt, wohlgemerkt jeweils in EINER
Datenbank.



Ausgehend von der Einsicht, daß 

erstens eine Reihe von Nutzern von allegro gibt, die fremdsprachliche
Codierungen verwenden wollen und dabei in der Regel auf sogenannte
Eingabeschemata zurückgreifen müssen (Twinbridge, NJStar usw.), um
überhaupt sinnvoll Daten eingeben zu können,

und zweitens davon ausgehend, daß bereits eine grosse Menge an
fremdsprachlichen Daten eingegeben wurden (v.a. unter DOS mit z.B.
ETEN),

und drittens diese Nutzer möglichst mit 'Bordmitteln', sprich
Windows2000/WinXP und allegro arbeiten wollen, OHNE teure zusätzliche
Software beschaffen zu müssen,

und viertens der Erkenntnis zollend, daß es KEINE Eingabeprogramme für
UTF-8 gibt,

habe ich das standardmäßig ausgelieferte allegro ein wenig modifiziert.


Im einzelnen:


Voraussetzung:

a. Windows2000 oder WinXP mit Installation der Eingabegebietsschemata
über 'Systemsteuerung', 'Regions-und Sprachoptionen', 'Sprachen' und
dort bei 'Textdienste und Eingabesprachen' griechisch, hebräisch,
japanisch, chinesisch Big5 und chinesisch GB2312 hinzufügen. Wird alles
sowieso mitgeliefert aber nicht automatisch installiert. 

b. Es ist nicht verkehrt zu prüfen, ob der Font 'Arial Unicode MS'
installiert ist. Denn darauf basiert das Ganze. 

c. Eine installierte allegro Voll- oder Demoversion Vs.25.8 !!! Erst
dort ist die Charsetumschaltung integriert. 

d. JEDER Datensatz benötigt eine Kennung, welche Codierung er aufweist.
In der vorliegenden Studie ist dies über die Kategorie #30l verwirklicht



Was funktioniert:

a. Die einzelnen Codierungen werden über die belegten Flip-Buttons
aufgerufen. Es kommt eine Ergebnismenge, in der gesucht werden kann in
der jeweils ausgesuchten Codierung. 

b. Es ist möglich neue Daten via Direkteingabe oder Formular in der
gewählten Codierung neu einzugeben oder zu ändern. Dazu muß lediglich
das Eingabegebietsschema von Windows aufgerufen werden (befindet sich in
der Taskleiste). Eingabe via Twinbridge usw. ist auch möglich. 

c. Die Daten sollten sowohl in der Kategorieübersicht, im Eingabefeld,
im Formular und in der Bildschirmanzeige korrekt erscheinen. 

d. Eine Suche über das 'Fernglas-Menü' funktioniert. 

e. Die Übernahme von Altdaten ist problemlos möglich. Die Datensätze
dieser Studie stammen aus dem Museum Rietberg, dem OAS und dem Museum
für Ostasiatische Kunst in Köln und sind teilweise Jahrzehnte alt !

f. Die Präsentation im Internet ist möglich bei allen einigermassen
neueren Browsern.

g. Die komplette Mischung aller im Font 'Arial Unicode MS' vorhandenen
Codierungen ist nun möglich. Russisch neben hebräisch neben japanisch
neben rumänisch usw. 


Was nicht funktioniert:

a. Die Suche über die Register funktioniert nicht richtig, dort sehen
die Daten je nach gewählter Codierung gut bis gruselig aus. Ich möchte
eine Reduzierung der Indexansicht gemäss der Sprache (Kategorie #30l)
anregen (etwas ähnliches funktioniert unter DOS).

b. Diese Version ist nicht länger DOS kompatibel weil der Zeichensatz
ASCII komplett durch ANSI ersetzt werden mußte (liegt am Font 'Arial
Unicode MS'). DOS Daten müssten nach ANSI konvertiert werden. (Bei den
als 'westlich' gekennzeichneten Daten sind noch solche DOS-Eingaben
sichtbar.)

c. Während die Mischung der Codierungen innerhalb einer Datenbank geht,
funktioniert sie leider (noch) nicht innerhalb eines Datensatzes !!!!

d. Und... dies ist nicht UTF-8, leider... aber es fehlen die
Eingabeprogramme und die zugehörigen Fonts, um UTF-8 ordentlich
verwenden zu können. Leider. Aber eine Wandlung, sprich Export nach
UTF-8 geht.


Was noch nicht integriert ist:

a. Die gesamte Verlinkung der Bildschirmanzeige habe ich einstweilen
entfernt. Da gibt es noch Probleme.


Was habe ich gemacht:

a. Herr Eversberg hat die Charsetumschaltung zur Verfügung gestellt
(allegro Vs. 25.8)

b. Die Datei 'o.apt' ist zwar vorhanden, aber leer !

c. Die Dateien 'd-rtf.apt', 'd.apt' sowie alle p- und q- Ersetzungen
habe ich aus der Bildschirmanzeige entfernt.

d. Alle Fontumschaltungen habe ich aus der Bildschirmanzeige entfernt.

e. In der 'disphead.rtf' wurden die benötigten Fonts integriert.

f. In der Bildschirmanzeige wurden Codierungsumschaltungen eingebaut.

g. Aus der 'cat.api' wurden die Eingabe Ersetzungen #-1 bis #-9 entfernt
ebenso wie alle p- und q- Ersetzungen.

h. Und es gibt eine Reihe von Umcodierungsflexen.


Auf Anfrage schicke ich gerne eine Demo, die auf der aktuellen
Demo-Datenbank von allegro beruht (Eine Mail mit einem Anhang im
ZIP-Format kommt über die Liste schlicht nicht an !?) . 

Viele Grüße 

Ihr Andreas Wolf





Mehr Informationen über die Mailingliste Allegro