[Allegro] Vb.244: Quelltexte zum Kernsystem - Was sollen/können sie bringen?

Bernhard Eversberg ev at biblio.tu-bs.de
Do Dez 15 10:36:39 CET 2011


Verlautbarung 244 der Entw.Abt.                              2011-12-15
-------------------------------

Das Projekt "OpenSource" soll nicht nur - so wichtig das auch ist - das
System allegro-C im Endeffekt aus der Abhängigkeit von "Braunschweig"
lösen. Es soll auch sein Potential vergrößern, indem damit anderen
Entwicklern eine Plattform gegeben wird, auf der Neues und Besseres
aufgebaut werden kann. Für allegro-Anwender bedeutet dies ein Mehr an
Zukunftssicherheit, aber ferner die Chance, für die eigenen Zwecke dann
auch an neuen Entwicklungen teilhaben zu können, mit denen vorhandene
Datenbanken neuen Verwendungen zugänglich werden können, und das ohne
schwierige und kostspielige Migration.

Quelltexte zum Kernsystem - Was sollen/können sie bringen?
----------------------------------------------------------

Die zentralen Quellcodes fuer das allegro-Kernsystem werden in
Kürze offengelegt. Es wird dazu einen README-Text geben, der
den Überblick schafft und den Einstieg unterstützen soll.
Erreicht ist jetzt, daß sich die Quellen mit dem GNU-System
kompilieren lassen sowie für Windows auch mit Visual C++.

Vor der Freigabe wollen wir an dieser Stelle schon mal auf einige
entscheidende Punkte hinweisen.

Es gibt nach aller Erfahrung zwei Arten von Situationen, die zu
Eingriffen ins Kernsystem motivieren oder zwingen können:
(einmal abgesehen von größeren Umbrüchen auf der Systemebene,
wie ganz neue Plattformen oder Compiler)

1. Es treten Probleme auf, die sich vermutlich nur in den
    Kernfunktionen lösen lassen. Z.B. Fehler bei der Abarbeitung
    bestimmter Exportbefehle oder beim Zugriff auf bestimmte
    Dateien.
    Dazu gibt es eine Liste der Quelldateien mit Angaben, welche
    Aufgaben sie erfüllen. Zwar ist jetzt ein vergleichsweise
    übersichtlicher Zustand erreicht, aber man wird daran noch
    weiter arbeiten müssen, um die Durchschaubarkeit noch zu
    verbessern - die Quellen sind z.T. sehr alt.

2. Man will eine Funktionsweise verändern oder ausbauen.
    Das weitaus Interessanteste Objekt dürfte das Volltext-Such- und
    Exportprogramm  srch  sein (zunächst srch32 genannt). Die
    16bit-Version ist bis heute ein unverzichtbares "Arbeitspferd".
    srch32 liest Datenbank- und Externdateien (.ald und .alg),
    wendet einen Suchbefehl an (Option -s oder -r) und gibt
    im Positivfall den Datensatz mit ausgewählten Exportparametern
    (also in einer gewünschten Struktur) aus.
    Hier wird es nun an mehreren Punkten möglich, die eingelesenen
    Daten vor dem Ausgeben zu behandeln und ihren Status als "Treffer"
    oder "Niete" zu verändern. Das bisher bestehende und seit
    langer Zeit intensiv genutzte Potential dieses Konsolprogramms
    wird damit stark erweitert. Das entscheidende Quellmodul heißt
    *srchs.c*  und ist intern ausführlich kommentiert.

Für den vermutlich wichtigsten und häufigsten Fall, daß man das
Programm  srch  als Grundlage für eigene Aufgaben heranziehen und
modifizieren will, ist damit auf der C-Ebene ein denkbar einfacher
Einstieg geschaffen, der ohne besondere Kenntnisse der internen
Algorithmen und Datenstrukturen auskommt. Man könnte z.B. so weit
gehen, hier einen ganz anderen Suchalgorithmus einzubinden oder
ganz andersartige Exportfunktionalität oder Datenmanipulationen
im weitesten Sinne, mit eigener Konfigurierschnittstelle.

Nicht neu ist, aber es bleibt wichtig: Wenn eine Aufgabe nicht in
einem Durchlauf mit srch erledigt werden kann, weil z.B. eine
Sortierung zwichendurch nötig ist, kann man mehrere Durchläufe in
einem Batch oder Shellscript kombinieren. Dabei kann natürlich auch
acon mit ins Spiel kommen, wenn es sich für eine Teilaufgabe besser
eignet.

Wenn man bedenkt, welches umfangreiche Spektrum das schon existierende
Konsolprogramm  acon  mit der Skriptsprache FLEX bietet, mag man sich
fragen, ob denn eigene C-Erweiterungen des Programms  srch  tatsächlich
der Mühe wert sein könnten. Nun, einerseits gestattet die C-Ebene mehr
und diffizilere Eingriffe als die FLEX-Ebene, und andererseits ist
das Programm  srch  als reines C-Programm viel schneller als  acon  mit
einem FLEX-Job (wie z.B. srch.job) wirklich sein kann.
Dazu ein Vergleich:
Zum Durchsuchen von 53 Dateien mit 684MB Daten (1.4 Mio Datensätze)
brauchte

   acon+srch.job     336 Sek.
   srch16            142
   srch32             23

Alles auf einem PC mit Win'7/32, bei exakt gleicher Suche und Ergebnis.
Das neue srch ist damit gut 6fach schneller als das alte, gut 14fach
schneller als acon mit srch.job. Das Zeitverhalten in konkreten Fällen
hängt stark vom System ab, vor allem vom Speichersystem, auch von der
Komplexität des jeweiligen Exports (Nachladungen!), doch die Botschaft
ist damit klar.





Mehr Informationen über die Mailingliste Allegro