[Allegro] Umstellung auf Unicode intern

Bernhard Eversberg ev at biblio.tu-bs.de
Di Mai 14 09:52:14 CEST 2013


Nochmals wurde geprüft, ob und ggfls. wie eine Umstellung auf Unicode
intern machbar wäre. Zwar gibt es im Programmiersystem Möglichkeiten,
mit Unicode zu arbeiten, diese jedoch im Kontext der allegro-
Quelltexte zu nutzen, stellt sich als ungemein schwierig dar, vor
allem angesichts des großen Umfangs der Quelltexte und der auf
8bit beruhenden Indexmodule. Der erforderliche Umstellungsaufwand
läßt sich nicht annähernd abschätzen.
Auf jeden Fall wäre es so, daß eine Maximallösung ein neues a99
erfordern würde, das mit den "alten" Datenbanken dann nicht mehr
arbeiten könnte. Man hätte folglich anschließend beide Varianten
zu pflegen, falls man nicht die ältere dann baldigste auslaufen
lassen wollte - doch das stieße wohl auf entschiedene Ablehnung.
Die anteren Programme, einschließlich acon, könnten dagegen
wohl unverändert weiterlaufen, jedenfalls könnte man damit auch
"alte" Daten weiterhin verarbeiten.

Fazit:
Für eine Maximallösung (für manche sicher die allein akzeptable) wäre
der Aufwand unkalkulierbar hoch. Die verfügbaren, auch zeitlichen,
Ressourcen reichen nicht hin, dies in überschaubarer Zeit zu leisten;
ein Zeitrahmen von z.B. 18 Monaten würde dazu sicher nicht reichen.
Aus personellen und anderen Gründen ist dies aber eine kritische Größe.
Ein Projekt anzustoßen, das deutlich länger brauchen würde, ist zu
riskant, weil eine erfolgreiche Beendigung unrealistisch ist, und
ein unfertiges Produkt würde niemandem nützen, aber Ressourcen für
den genannten Zeitraum binden - das ist unvertretbar.
Es sieht demzufolge danach aus, daß es eine Maximallösung - Unicode
total - aus unserem Hause nicht geben kann.

Erreichbar, und zwar in erheblich kürzerer Zeit, ist folgende
Teillösung:

1. Umstellung auf UTF-8 intern in den Datendateien, wobei dann
    a99 nutzbar wäre, aber die UTF-Zeichen könnte man damit nicht
    bearbeiten, sondern nur extern in Notepad, was ja auch jetzt
    schon geht! Es gibt da nur noch Detailprobleme mit einigen
    Sonderzeichen zu lösen sowie solche Dinge wie korrekte Anzeige
    von existierenden ViewListen.
    Es bliebe dabei, daß es nur *eine* a99-Version gibt!
    "Alte" Datenbanken könnten damit unverändert weiterarbeiten.

2. Erarbeitung einer Mini-Konfiguration, und zwar Aktualisierung
    und Erweiterung des schon vorliegenden MINI-UNI-Pakets.
    Dabei käme ein vollständiger Satz der notwendigen Tabellen und
    einige Muster für Parameterdateien heraus, die dann in
    existierende Anwendungen übernommen werden könnten, wenn man
    diese umstellen will.
    Neue Anwendungen könnten auf dieser Mini-Konfiguration aufsetzen
    und müßten dann im wesentlichen nur die Index- und Anzeigeparameter
    noch erstellen.
    Bestehende Anwendungen, die nicht umgestellt werden sollen,
    können ohne Änderungen an ihren Parametern weiterlaufen.

3. Für die Standardanwendung wären dann die Parameter entsprechend
    anzupassen sowie eine Umstellungsmethodik (mit FLEX und einigen
    Parametern) zu erarbeiten, die eine A-Datenbank geeignet exportiert
    und neu indexiert, so daß dann unmittelbar weitergearbeitet werden
    könnte. Im wesentlichen geht es dabei um einen Austausch von
    Umwandlungstabellen und Änderungen einiger Texte, vor allem
    in Anzeigeparametern.

4. Umstellung einiger wichtiger FLEXe, vor allem zc.flx für die
    Z39-Übernahme und dnb.flx für DNB-Daten.

5. Erweiterung von a35, um das Erfassen und Bearbeiten von Daten
    im Browser weiter zu verbessern, z.B. eine bequeme Erstellung
    von eigenen Formularen. Die Methodik dazu ist vorhanden, es ist
    dazu keine Programmierung in C vonnöten, im wesentlichen FLEX.

Erreicht wäre damit, daß man einen erheblich größeren Zeichen-
vorrat nutzen könnte bei gleichzeitig viel geringerem Aufwand
für Im- und Exporte.

Nochmals: Wer Unicode nicht braucht, wird auch mit den geänderten
Programmen unverändert weiterarbeiten können, also keinen
Aufwand zu gewärtigen haben.
Ganz nebenbei: Auch eine umgestellte Datenbank wird man immer noch
mit PRESTO nutzen können (wo es denn noch läuft), wobei natürlich
die UTF-Zeichen kryptisch erscheinen und nicht komfortabel bearbeitbar
sind. Wirklich notwendig ist diese Option aber in keinem Fall.

Die Schritte 1 und 2 können in wenigen Wochen erledigt sein,
für die restlichen würden wohl maximal drei Monate gebraucht.
Danach kann man nochmal reden über denkbare weitere Schritte.

B.E.



Mehr Informationen über die Mailingliste Allegro