Vb. XML
Jochen Thamm
thamm at leopoldina-halle.de
Do Apr 1 09:27:38 CEST 2004
Datum: Thu, 01 Apr 2004 08:46:07 +0200
Von: Bernhard Eversberg <ev at buch.biblio.etc.tu-bs.de>
Betreff: Vb. XML
An: Diskussionsliste Allegro-C <allegro at buch.biblio.etc.tu-bs.de>
Antwort an: allegro at buch.biblio.etc.tu-bs.de
Organisation: Universitaetsbibliothek
>
Lieber Herr Eversberg,
das ist der Durchbruch. Endlich geben Sie Ihre Sturheit auf! Aber bitte
doch keine deutschen Namen fuer die tags (Umlaute, Datenaustausch).
Englisch oder noch besser, wie schon lange von Frau Koczian
gefordert, lateinisch. Jeder uebersetzt einen Begriff und bekommt dafuer
Rabatt beim Erwerb von V25. Ich uebernehme schon mal <impressum>
> Alles neu macht XML!
>
> Immer wieder wurde uns unter die Nase gerieben, dass die Zukunft in XML
> liege. Ebenso oft hatten wir abgewiegelt und beschwichtigt, es werde alles
> nicht so heiss gegessen wie gekocht, es waere schon so mancher neue Trend
> alsbald wieder in der Versenkung verschwunden usw. usf. Das hilft aber
> alles nichts, wir muessen uns dem Zeitgeist stellen, wir koennen das nicht
> "ad calendas graecas" vertagen. Nach einer laengeren Machbarkeitsstudie (in
> weltabgeschiedener Waldeinsamkeit absolviert, damit nichts nach aussen
> dringe) koennen wir heute eine Ankuendigung wagen:
>
> Erstmals in der allegro-Geschichte wird es einen Bruch in der
> Kontinuitaet der Kompatibilitaet geben: V25 wird keine aeltere
> Datenbank mehr lesen koennen, V25 wird mit XML arbeiten und
> mit sonst nichts.
>
> -- Statt aus zig Kategorien wird ein Datensatz aus einer einzigen
> Zeichenkette bestehen, strukturiert durch lauter spitzgeklammerte
> Tags (siehe unten)
>
> -- V24.X wird einen neuen FLEX-Befehl namens "xml" beinhalten, der
> jeden Datensatz in eine XML-Zeichenkette verwandelt. Damit
> kann der unumkehrbare Aufstieg zu V25 muehelos vollzogen werden
>
> -- Export- und Importsprache, diese kryptischen Monstrositaeten,
> werden ueberfluessig - konsequent kommen XML-Tools zum Einsatz. Die
> muessen wir nicht selber entwickeln, die gibt's auf dem freien Markt,
> und jeder XML-Kenner, also jeder, kann damit umgehen.
>
> Gewiss, ein Datensatz braucht dann mehr Platz und die Verarbeitung
> etwas laenger, z.B. die Indexierung, aber schon der ganz normale
> Aldi-PC fuer 999 EUR hat heute 160 GB und 3 MHz, also was soll's!
> Dann reicht die Zeit zum Indexieren wieder fuer eine Kaffeepause oder
> einen Kloenschnack, wie frueher.
>
> Und wie sieht dann ein allegro-Datensatz aus?
> Bisher haben wir, unglaublich sproede und sich der Intuition des
> Betrachters verschliessend, so etwas wie dieses:
>
> #00 654321
> #20 Was können wir wissen?
> #30aNA PH
> #31 Evolutionäre Erkenntnistheorie
> #40 Vollmer, Gerhard
> #74 Stuttgart
> #75 Hirzel
> #76 1985-
> #77 Bd.1.2.
> #01 1
> #20 ¬Die¬ Natur der Erkenntnis : Beiträge zur Evolutionären
> #Erkenntnistheorie 25 Mit einem Geleitw. v. Konrad Lorenz 76 1992 77 337 S.
> #87 3-7776-0403-8 90 2647-3611 01 2=Bd. 2 20 ¬Die¬ Erkenntnis der Natur :
> #Beiträge zur modernen Naturphilosophie 77 350 S. 87 3-7776-0404-6 90
> #2650-9705
>
> Daraus wird durch "xml" auf einmal transparenter Klartext:
>
> <?xml version="1.0" encoding="iso-8859-1" ?>
> <#allegro-datensatz>
> <#identnummer>a12345</#identnummer>
> <#eigner sigel="84">Universitätsbibliothek Braunschweig</#eigner>
> <#hauptsatz>
> <#titel>Was können wir wissen?</#titel>
> <#sachgruppe>NA</#sachgruppe>
> <#sachgruppe>PH</#sachgruppe>
> <#verfasser>
> <#vorname>Gerhard</#vorname>
> <#nachname>Vollmer</#nachname>
> </#verfasser>
> <#schlagwort system="swd">Evolutionäre Erkenntnistheorie</#schlagwort>
> <#impressum>
> <#erscheinungsort>Stuttgart</#erscheinungsort>
> <#verlag>Hirzel</#verlag>
> </#impressum>
> <#erscheinungsjahr typ="offen">1985-</#erscheinungsjahr>
> <#umfang><#baende>Bd.1.2.</#baende></#umfang>
> </#hauptsatz>
> <#untersatz level="1">
> <#bandnummer>1</#bandnummer>
> <#sortierfaehige-bandnummer>001</#sortierfaehige-bandnummer>
> <#titel>
> <#hauptteil><#nichtsort>Die </#nichtsort>Natur der
> Erkenntnis</#hauptteil> <#zusatz>Beiträge zur Evolutionären
> Erkenntnistheorie</#zusatz> <#ergaenzung>Mit einem Geleitw. v. Konrad
> Lorenz</#ergaenzung>
> </#titel>
> <#erscheinungsjahr>1992</#erscheinungsjahr>
> <#umfang>337 S.</#umfang>
> <#isbn typ="alt">3-7776-0403-8</#isbn>
> <#signatur typ="magazin">2647-3611</#signatur>
> </#untersatz>
> <#untersatz level="1">
> <#bandnummer>Bd. 2</#bandnummer>
> <#sortierfaehige-bandnummer>002</#sortierfaehige-bandnummer>
> <#titel>
> <#hauptteil><#nichtsort>Die </#nichtsort>Erkenntnis der
> Natur</#hauptteil> <#zusatz>Beiträge zur modernen
> Naturphilosophie</#zusatz>
> </#titel>
> <#erscheinungsjahr>1985</#erscheinungsjahr>
> <#umfang>350 S.</#umfang>
> <#isbn typ="alt">3-7776-0404-6</#isbn>
> <#signatur typ="magazin">2650-9705</#signatur>
> </#untersatz>
> </#allegro-datensatz>
>
>
> Natuerlich ist das eine etwas vereinfachte Fassung, damit das
> Grundkonzept deutlicher ins Auge sticht. Sie sehen: keine Nuemmerchen
> mehr, die man erst lernen muesste, keine Betulichkeiten mit
> speziellen Indikatoren, Interpunktionen und Unterfeld-Symboelchen.
> Keiner muss das manuell so eingeben, damit wir uns recht verstehen! Dafuer
> gibt's XML-Editoren, z.B. XMLPAD von Onkel Bill, damit ist das ein
> Vergnuegen. Nur das V25-XML-Schema wird gebraucht.
>
> Solche Datensaetze liegen dann, egal wie viele, als separate Dateien
> auf einem Verzeichnis des Webservers oder auch in einem weitverzweigten
> Baum von sinnreich verschachtelten Unterverzeichnissen. Der Dateiname ist,
> Sie erraten es, schlicht die Identnummer. Keine Steuerzeichen, keine
> hexadezimalen internen Satznummern - alles ploetzlich viel einfacher, alles
> ploetzlich offen und nicht mehr proprietaer im obskuren "Invisible Web"
> verborgen! Das hat den Riesenvorteil, dass dann Google diese Dateien ganz
> leicht einsammeln und indexieren kann. Und weil sowieso jeder lieber
> googelt als a99t, eruebrigt sich auf einmal die eigene Indexierung, sie
> wird sozusagen kostenfrei outgesourct, und die Kaffeepause kann damit noch
> viel laenger werden. Ganz neu ist die Idee nicht, aber erst jetzt
> konsequent zu Ende gedacht! (HBZ und OCLC machen schon aehnliche Dinge,
> aber doch sehr halbherzig.) Ein schlichtes JavaScriptchen holt dann den per
> Google gefundenen Datensatz in den XML-Editor eigener Wahl. Das ganze
> Record-Management entfaellt, das macht ja dann das Dateisystem.
> Exportieren? Das geht mit dem viel leichteren XSLT. Und FLEX? Muss auch
> nicht mehr gelernt werden. Was man davon noch braucht, kann ebenfalls XSLT
> oder aber JavaScript uebernehmen.
>
> "Aber", fragen die ganz eingefleischten allegrologen, "was bleibt von
> 'allegro' dann noch uebrig?" Erstens die Daten, nun aber viel besser
> verpackt, und zweitens das unverwechselbare # in den Tags, das hat
> sonst keiner! Dadurch bleibt die Sache auch dezent, denn wir vermeiden,
> sowas wie <allegro:titel> schreiben zu muessen, was denn doch unnoetig
> aufgeplustert wirken wuerde.
>
> Man wird verstehen, dass so viele Vorteile ihren Preis haben muessen.
> Ganz genau steht's noch nicht fest, aber legen Sie fuer V25 schon
> mal etwas mehr auf die Seite...
>
> "Wenn aber", wirft jetzt vielleicht noch jemand von der alten Schule
> ein, "Google doch nicht alle Dateien indexiert, oder nicht schnell
> genug?" Eine gute Frage, sie fuehrt auf *den* zentralen Punkt:
> Die Obsession mit dem vollstaendigen, lueckenlosen Nachweis, die
> entstand in Zeiten der Knappheit. Als man drauf angewiesen war, alles
> Zutreffende finden zu koennen, es gab halt zu wenig Dokumente. Nun aber
> sind Zeiten der Ueberfuelle, wir haben einen Paradigmenwechsel! Es ist
> *erwuenscht*, dass Ergebnismengen sich in Grenzen halten, dass man nicht
> erschlagen wird von unbewaeltigbaren Massen. Und um genau dies zu
> erreichen, muss man nichts parametrieren, konfigurieren oder FLEXen, das
> ergibt sich aus dem neuen Kernkonzept wie von selbst.
>
> In diesem Sinne,
> B.E.
>
>
>
>
> Bernhard Eversberg
> Universitaetsbibliothek, Postf. 3329,
> D-38023 Braunschweig, Germany
> Tel. +49 531 391-5026 , -5011 , FAX -5836
> e-mail B.Eversberg at tu-bs.de
>
Jochen Thamm
Bibliothek der Leopoldina
PF 110543,D 06019 Halle
Tel.: 0345/4723947
FAX : 0345/4723949
Mehr Informationen über die Mailingliste Allegro