Vb. XML

Bernhard Eversberg ev at buch.biblio.etc.tu-bs.de
Do Apr 1 08:46:07 CEST 2004


Alles neu macht XML!

Immer wieder wurde uns unter die Nase gerieben, dass die Zukunft in XML
liege. Ebenso oft hatten wir abgewiegelt und beschwichtigt, es werde
alles nicht so heiss gegessen wie gekocht, es waere schon so mancher
neue Trend alsbald wieder in der Versenkung verschwunden usw. usf.
Das hilft aber alles nichts, wir muessen uns dem Zeitgeist stellen, wir koennen 
das nicht "ad calendas graecas" vertagen.
Nach einer laengeren Machbarkeitsstudie (in weltabgeschiedener
Waldeinsamkeit absolviert, damit nichts nach aussen dringe) koennen
wir heute eine Ankuendigung wagen:

Erstmals in der allegro-Geschichte wird es einen Bruch in der
Kontinuitaet der Kompatibilitaet geben: V25 wird keine aeltere
Datenbank mehr lesen koennen, V25 wird mit XML arbeiten und
mit sonst nichts.

-- Statt aus zig Kategorien wird ein Datensatz aus einer einzigen
   Zeichenkette bestehen, strukturiert durch lauter spitzgeklammerte 
   Tags (siehe unten)

-- V24.X wird einen neuen FLEX-Befehl namens "xml" beinhalten, der
   jeden Datensatz in eine XML-Zeichenkette verwandelt. Damit
   kann der unumkehrbare Aufstieg zu V25 muehelos vollzogen werden

-- Export- und Importsprache, diese kryptischen Monstrositaeten,
   werden ueberfluessig - konsequent kommen XML-Tools zum Einsatz. Die
   muessen wir nicht selber entwickeln, die gibt's auf dem freien
   Markt, und jeder XML-Kenner, also jeder, kann damit umgehen.

Gewiss, ein Datensatz braucht dann mehr Platz und die Verarbeitung
etwas laenger, z.B. die Indexierung, aber schon der ganz normale
Aldi-PC fuer 999 EUR hat heute 160 GB und  3 MHz, also was soll's!
Dann reicht die Zeit zum Indexieren wieder fuer eine Kaffeepause oder
einen Kloenschnack, wie frueher.

Und wie sieht dann ein allegro-Datensatz aus?
Bisher haben wir, unglaublich sproede und sich der Intuition des
Betrachters verschliessend, so etwas wie dieses:

#00 654321
#20 Was können wir wissen?
#30aNA PH
#31 Evolutionäre Erkenntnistheorie
#40 Vollmer, Gerhard
#74 Stuttgart
#75 Hirzel
#76 1985-
#77 Bd.1.2.
#01 1
#20 ¬Die¬ Natur der Erkenntnis : Beiträge zur Evolutionären Erkenntnistheorie 
#25 Mit einem Geleitw. v. Konrad Lorenz 
#76 1992 
#77 337 S. 
#87 3-7776-0403-8 
#90 2647-3611 
#01 2=Bd. 2 
#20 ¬Die¬ Erkenntnis der Natur : Beiträge zur modernen Naturphilosophie 
#77 350 S. 
#87 3-7776-0404-6 
#90 2650-9705

Daraus wird durch "xml" auf einmal transparenter Klartext:

<?xml version="1.0" encoding="iso-8859-1" ?>
<#allegro-datensatz>
   <#identnummer>a12345</#identnummer>
   <#eigner sigel="84">Universitätsbibliothek Braunschweig</#eigner>
<#hauptsatz>
   <#titel>Was können wir wissen?</#titel>
   <#sachgruppe>NA</#sachgruppe>
   <#sachgruppe>PH</#sachgruppe>
   <#verfasser>
       <#vorname>Gerhard</#vorname>
       <#nachname>Vollmer</#nachname>
   </#verfasser>
   <#schlagwort system="swd">Evolutionäre Erkenntnistheorie</#schlagwort>
   <#impressum>
      <#erscheinungsort>Stuttgart</#erscheinungsort>
      <#verlag>Hirzel</#verlag>
   </#impressum>
   <#erscheinungsjahr typ="offen">1985-</#erscheinungsjahr>
   <#umfang><#baende>Bd.1.2.</#baende></#umfang>
</#hauptsatz>
<#untersatz level="1">
   <#bandnummer>1</#bandnummer>
   <#sortierfaehige-bandnummer>001</#sortierfaehige-bandnummer>
   <#titel>
     <#hauptteil><#nichtsort>Die </#nichtsort>Natur der Erkenntnis</#hauptteil>
     <#zusatz>Beiträge zur Evolutionären Erkenntnistheorie</#zusatz>
     <#ergaenzung>Mit einem Geleitw. v. Konrad Lorenz</#ergaenzung>
   </#titel>
   <#erscheinungsjahr>1992</#erscheinungsjahr>
   <#umfang>337 S.</#umfang>
   <#isbn typ="alt">3-7776-0403-8</#isbn>
   <#signatur typ="magazin">2647-3611</#signatur>
</#untersatz>
<#untersatz level="1">
   <#bandnummer>Bd. 2</#bandnummer>
   <#sortierfaehige-bandnummer>002</#sortierfaehige-bandnummer>
   <#titel>
     <#hauptteil><#nichtsort>Die </#nichtsort>Erkenntnis der Natur</#hauptteil>
     <#zusatz>Beiträge zur modernen Naturphilosophie</#zusatz>
   </#titel>
   <#erscheinungsjahr>1985</#erscheinungsjahr>
   <#umfang>350 S.</#umfang>
   <#isbn typ="alt">3-7776-0404-6</#isbn>
   <#signatur typ="magazin">2650-9705</#signatur>
</#untersatz>
</#allegro-datensatz>


Natuerlich ist das eine etwas vereinfachte Fassung, damit das
Grundkonzept deutlicher ins Auge sticht. Sie sehen: keine Nuemmerchen
mehr, die man erst lernen muesste, keine Betulichkeiten mit
speziellen Indikatoren, Interpunktionen und Unterfeld-Symboelchen.
Keiner muss das manuell so eingeben, damit wir uns recht verstehen! Dafuer gibt's
XML-Editoren, z.B. XMLPAD von Onkel Bill, damit ist das ein Vergnuegen. Nur das
V25-XML-Schema wird gebraucht.

Solche Datensaetze liegen dann, egal wie viele, als separate Dateien 
auf einem Verzeichnis des Webservers oder auch in einem weitverzweigten Baum von
sinnreich verschachtelten Unterverzeichnissen. Der Dateiname ist, Sie erraten es,
schlicht die Identnummer. Keine Steuerzeichen, keine hexadezimalen internen
Satznummern - alles ploetzlich viel einfacher, alles ploetzlich offen und nicht
mehr proprietaer im obskuren "Invisible Web" verborgen! Das hat den 
Riesenvorteil, dass dann Google diese Dateien ganz leicht einsammeln und 
indexieren kann. Und weil sowieso jeder lieber googelt als a99t, eruebrigt sich 
auf einmal die eigene Indexierung, sie wird sozusagen kostenfrei outgesourct, und 
die Kaffeepause kann damit noch viel laenger werden. Ganz neu ist die Idee nicht, 
aber erst jetzt konsequent zu Ende gedacht! (HBZ und OCLC machen schon aehnliche 
Dinge, aber doch sehr halbherzig.) 
Ein schlichtes JavaScriptchen holt dann den per Google gefundenen Datensatz in 
den XML-Editor eigener Wahl. Das ganze Record-Management entfaellt, das macht ja 
dann das Dateisystem. Exportieren? Das geht mit dem viel leichteren XSLT. Und 
FLEX? Muss auch nicht mehr gelernt werden. Was man davon noch braucht, kann 
ebenfalls XSLT oder aber JavaScript uebernehmen.

"Aber", fragen die ganz eingefleischten allegrologen, "was bleibt von 
'allegro' dann noch uebrig?" Erstens die Daten, nun aber viel besser
verpackt, und zweitens das unverwechselbare # in den Tags, das hat
sonst keiner! Dadurch bleibt die Sache auch dezent, denn wir vermeiden,
sowas wie <allegro:titel> schreiben zu muessen, was denn doch unnoetig
aufgeplustert wirken wuerde.

Man wird verstehen, dass so viele Vorteile ihren Preis haben muessen.
Ganz genau steht's noch nicht fest, aber legen Sie fuer V25 schon
mal etwas mehr auf die Seite...

"Wenn aber", wirft jetzt vielleicht noch jemand von der alten Schule
ein, "Google doch nicht alle Dateien indexiert, oder nicht schnell
genug?" Eine gute Frage, sie fuehrt auf *den* zentralen Punkt: 
Die Obsession mit dem vollstaendigen, lueckenlosen Nachweis, die
entstand in Zeiten der Knappheit. Als man drauf angewiesen war, alles
Zutreffende finden zu koennen, es gab halt zu wenig Dokumente. Nun aber sind
Zeiten der Ueberfuelle, wir haben einen Paradigmenwechsel! Es ist 
*erwuenscht*, dass Ergebnismengen sich in Grenzen halten, dass man
nicht erschlagen wird von unbewaeltigbaren Massen. Und um genau dies zu 
erreichen, muss man nichts parametrieren, konfigurieren oder FLEXen, das ergibt
sich aus dem neuen Kernkonzept wie von selbst.

In diesem Sinne,
B.E.




Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329, 
D-38023 Braunschweig, Germany
Tel.  +49 531 391-5026 , -5011 , FAX  -5836
e-mail  B.Eversberg at tu-bs.de  




Mehr Informationen über die Mailingliste Allegro