Zeichen >127 bei acwww25 (in Anzeige und Kurztitelzeile)

Allers Heinrich allers at goethe.de
Fr Mär 23 17:19:26 CET 2001


Liebe acwww25-Kenner:

     
    zugegebenermaßen hatte ich bisher die Frage der Darstellung in Anzeige
und Kurztitelzeile der Zeichen des Ostwest-Fonts mit Codierung >127
angesichts anderer Arbeit, die das Bereitstellen von Allegro-Datenbanken
macht, vollkommen vernachlässigt.

Kürzlich machte ich mich an dieses liegengebliebene Thema heran, und es
artete doch in ziemliche Arbeit aus.- Wie haben das die von gleichem
Zeichenanfall (Zeichen außerhalb von Latin-1) getroffenen Kollegen
eigentlich gelöst? Ich frage, weil ich Sorge habe, das Rad womöglich noch
einmal, und noch dazu in mieserer Ausführung, erfunden zu haben, und daß ich
da gut etwas hätte übernehmen können.

Die Realisierung von ausgefallenen Zeichen in der Anzeige unter Netscape ist
dabei noch das einfachste: Nehmen wir mal als Beispiel das S mit dem Komma
drunter (das S cedille), Codierung in Unicode hexadezimal 015E und dezimal
350. 

Übrigens: In diesem Dschungel von seltenen Zeichen sich zurechtzufinden,
dabei halfen mir in entscheidender Weise einerseits die Datenbank UNIC -
Unicode Reference Database of Character Encodings -, die 1997 von B.
Eversberg zur Verfügung gestellt wurde, und andererseits ein von D. Lahmann
mir überlassenes Dateigefüge, das eine Tabelle der Unicode-Zeichen mitsamt
ihrer Codierung und ihrer graphischen Darstellung enthält.

Mit der in die Anzeigeparameterdatei (oder in die in sie eingebundene
Umschlüsselungsdatei) eingefügten Zeile

p .208 "Ş"

(bei der von uns benutzten Variante des Ostwest-Fonts liegt das "S cedille"
auf dem Code 208) bewirkt die korrekte Darstellung dieses Zeichens in der
Anzeige - wobei allerdings (unter Netscape) die Umschaltung auf Zeichensatz
"Unicode (UTF-8)" die Voraussetzung bildet.

Aber gerade diese Voraussetzung zieht für denjenigen, der in der
WWW-Präsentation seiner Datenbank nicht konsequent Umlaute und weitere
Sonderzeichen im Stile von "ä" (für a-Umlaut) einzugeben durchgehalten,
sondern sich vom gerade benutzten html-Editor dazu hat verleiten lassen,
einfach ein 'ä' (a-Umlaut) einzutippen, umfangreiche Nacharbeiten mit sich!
(Das Gleiche gilt für den, der bei Allegro-Parametrierungen entsprechend
verfahren ist).

Schwieriger war es, dafür zu sorgen, daß auch in den Kurztitelzeilen die
"Sonderzeichen" richtig herauskamen. Bis D. Höppner mich darauf hinwies,
hatte ich nicht gewußt, daß sich diese Angelegenheit im Unterprogramm
anz_prep von acwww25.pl befindet. Aber auch wenn man dort eingreift, bleibt
es noch verwickelt: Die dort untergebrachten Umsetzungen von
Zeichencodierungen in html-Code dürfen nicht etwa von dem ASCII-Code
ausgehen, den das jeweilige Zeichen ursprünglich in der Datenbank hat,
sondern müssen von dem ANSI-Code ausgehen, den es in o.apt zugewiesen
bekommt. Am Ende eigentlich ganz einfach und irgendwie logisch, aber ich bin
auch nur durch Hinweis von D. Höppner drauf gekommen.

Einen Ausschnitt aus dem Ergebnis meiner Bemühungen (die ich am Ende als
erfolgreich ansehe) ist hier zu sehen:

http://buch.goethe.de/cgi-bin/acwww25/liteax.pl?s1=gs+litedida&db=lite  

und zwar in der Zeile unter "Hunfeld, ...: Literatur als Sprachlehre": Wenn
man sich die Sache unter Einstellung auf Zeichensatz "Unicode (UTF-8)"
anschaut, sieht man schön das "S cedille" als erstes Zeichen des folgenden
Kurztiteleintrages.

Aber was ich noch nicht geschafft habe, ist, dafür zu sorgen, daß dieser
Kurztitel dort auftaucht, wo er der alphabetischen Ordnung nach hingehört,
nämlich unter den Eintrag "Semper, Lothar: ...".

Das ist die große Frage und Bitte, mit der ich diese - als Erfahrungsbericht
hoffentlich nicht zu lang geratene - Nachricht schließe: Kann mir jemand zu
diesem Problem Hinweise geben? Mir würde ja auch reichen, wenn mir jemand
die Mechanismen und Agenten nennt, die dafür sorgen, daß diese
Kurztiteleinträge - von Ausreißern dieser Art abgesehen - ganz schön
sortiert rauskommen. Ich weiß, der avanti-w-Befehl "order" spielt da 'ne
Rolle, aber i.apt kann schon nicht mehr mitspielen (denn wenn es das täte,
wäre mein mit dem "S cedille" beginnender Kurztitel an der richtigen Stelle
gelandet) - der Rest ist mir vollkommen schleierhaft.


Mit freundlichen Grüßen:

Heinrich Allers

Goethe-Institut, Postfach 19 04 19, D-80604 München
Tel. ++89 / 15921 471; Telefax: ++89 / 15921 435
allers at goethe.de; http://home.t-online.de/home/allers
* Kulturen in Deutschland? Ja!
  Deutsche Leitkultur? Nein, Danke!
  http://www.goethe.de/z/30/ogf/leitkult.htm




Mehr Informationen über die Mailingliste Allegro