[Allegro] Ersetzungen

Thomas Berger ThB at Gymel.com
Mo Aug 13 15:42:00 CEST 2007


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Becker, liebe Liste,


>> Der einzige nicht-krumme Ansatz wuerde wohl zu viele Leute arbeitslos
>> machen, oder warum koennen Sie sich dafuer nicht erwaermen?
> 
> Arbeitslos würde wohl nur mein Word-Makro. Ich selbst hätte wohl noch
> mehr Arbeit. Wenn ich das richtig verstanden habe, kann a99 Unicode
> nicht (in lesbarer Form) abbilden. Da wir aber hier Recherchen für
> Benutzer in a99 durchführen, ist es wichtig, dass man auf dem Bildschirm
> auch lesen kann, was in dem Datensatz steht (wir haben auch lange
> Abstracts).  Mit Anzeigen 0x00F5 kommen unsere Leute (und ich) nicht
> zurecht. Selbst wenn man Anzeigeparameter hätte, wären Änderungen an den
> Abstracts so eine Qual.

Die LaTeX-Escapes fuer Diakritika sind auch fuer TeX nur dann noetig,
wenn der Quelltext nicht in UTF-8 oder einer anderen Codierung vorliegt,
die das Benoetigte direkt darstellen kann. Ansonsten sind sie auch
fuer Bearbeiter problematisch, weil man einiges ueber TeX wissen muss,
um nicht oft auf die Nase zu fallen. Ich selber wuerde immer
Ha\v{c}ek schreiben, weil ich Ha\v cek fuer zu unintuitiv halte (und
jemand dann bestimmt irgendwann Ha\vc ek oder Ha\v c ek schriebe).
Hingegen ist Ha{\v c}ek und Ha\v c{}ek oder Ha \v cek etc. alles
korrekt. Sie koennten mit den Mechanismen von vb163 z.B. festlegen,
dass alles zwischen "\" und "{" eine Steuersequenz ist (und alle
uebrigen "{" und "}" toeten). Damit muesste sich eigentlich ein
Eingabeszenario definieren lassen, allerdings ist dann
Ma\ss nicht mehr erlaubt, sondern nur Ma\ss{}, wie sie es
fuer "Ma\ss{}nahme" aber sowieso schreiben muessten,
Ma{\ss} und Ma{\ss}nahme sind allerdings leider auch nicht mehr
erlaubt. Aber moeglicherweise kommen Sie ja auch mit "\" und " "
als Begrenzer fuer Sequenzen hin.

Sie haben uebrigens noch nicht wirklich verraten, warum der
OSTWEST-Zeichensatz Ihnen nicht ausreicht. Ansonsten ist es so,
dass man auch dann, wenn in der Datenbank die Sonderzeichen "nativ"
stehen (in irgendeiner Codierung, aber nicht a la TeX oder HTML oder ...
escaped), Word-Makros normalerweise die schlechteste Wahl sind, um die
Zeichen umzusetzen (weil Word oft beim Einlesen undurchsichtige
Dinge treibt), Exporte mit allegro sind normalerweise die Methode
der Wahl, z.B. nach Unicode.

0x00F5 ist uebrigens nicht Unicode, sondern Unicode plus eine gewaehlte
Codierung, wobei mir nicht klar ist, ob Sie darauf hinauswollen, dass
die Bearbeiter mit aufgesetzter Binaerbrille auf dem Bildschirm die
beiden Bytes 00 F5 ablesen sollen, oder ob in der Datenbank die
6 Zeichen "0", "x", "0", "0", "F" und "5" stehen. Beides ist im
uebrigen keine schlaue Codierung, weil Unicode weit mehr Zeichen
umfasst, als sich auf 65536 Codepositionen abbilden liessen...

Die Verlautbarung 163 beschreibt mit den V-Sequenzen einen ziemlich
schmerzlosen Weg, um die Datenbank Unicode-faehig zu machen, d.h. die
Codierung bleibt, wie sie ist, alle durch die Codierung nicht
abbildbaren Unicode-Zeichen werden in der Datenbank als "&#....;"
codiert und sind dank der VS-Methodik lesbar indexierbar und exakt
darstellbar. Dazu muessen Sie in Ihrem Datenbestand nur alle "&"
auf "&" umsetzen, um Ambiguitaeten zu vermeiden, ein paar
Parameterdateien ueberarbeiten und die Unicode Character Database
(http://www.unicode.org/Public/UNIDATA/) in Ihre Datenbank importieren.



> Eine Alternative wäre wohl eine Web-Umgebung, die wiederum alle Arbeiten
> am System, die wir hier durchführen, abbilden müsste. Da wir in einigen
> Fällen nicht dem Allegro-Standard entsprechen (z.B. ein bis zu
> elf-stufiger Thesaurus [nicht meine Idee, sonder historisch gewachsen]),
> wäre wohl ein enormer Programmieraufwand zu befürchten.

Nicht deswegen, aber weil es noch nie irgendeinen Hinweis gegeben hat,
wie man in einer Web-Umgebung effizient verknuepfen kann...

viele Gruesse
Thomas Berger

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.3-nr1 (Windows XP)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iD8DBQFGwF+ohKFJT0F1FsoRAs1gAKCDi+U38it71cq036yV4UMEgoqyEgCffnao
SECzNG58W1flQ3lgh36LC58=
=HSuH
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro