Vb. XML

Thomas Berger ThB at gymel.com
Do Apr 1 09:41:24 CEST 2004


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg,

alles wohlausgedacht und ganz nett und ich werde Sie da in die Pflicht
nehmen, aber war heute nicht ein Aprilscherz faellig?

viele Gruesse
Thomas Berger

im einzelnen:

Bernhard Eversberg wrote:
| Alles neu macht XML!
|
| Immer wieder wurde uns unter die Nase gerieben, dass die Zukunft in XML
| liege. Ebenso oft hatten wir abgewiegelt und beschwichtigt, es werde
| alles nicht so heiss gegessen wie gekocht, es waere schon so mancher
| neue Trend alsbald wieder in der Versenkung verschwunden usw. usf.
| Das hilft aber alles nichts, wir muessen uns dem Zeitgeist stellen,
wir koennen
| das nicht "ad calendas graecas" vertagen.
| Nach einer laengeren Machbarkeitsstudie (in weltabgeschiedener
| Waldeinsamkeit absolviert, damit nichts nach aussen dringe) koennen
| wir heute eine Ankuendigung wagen:
|
| Erstmals in der allegro-Geschichte wird es einen Bruch in der
| Kontinuitaet der Kompatibilitaet geben: V25 wird keine aeltere
| Datenbank mehr lesen koennen, V25 wird mit XML arbeiten und
| mit sonst nichts.
|
| -- Statt aus zig Kategorien wird ein Datensatz aus einer einzigen
|    Zeichenkette bestehen, strukturiert durch lauter spitzgeklammerte
|    Tags (siehe unten)

viel lesbarer als eine .ald-Datei!


| -- V24.X wird einen neuen FLEX-Befehl namens "xml" beinhalten, der
|    jeden Datensatz in eine XML-Zeichenkette verwandelt. Damit
|    kann der unumkehrbare Aufstieg zu V25 muehelos vollzogen werden

sehr gut, ich mache das bislang immer mit Exportparametern,
uebergangsweise koennte man den Flex "X xml" nehmen.


| -- Export- und Importsprache, diese kryptischen Monstrositaeten,
|    werden ueberfluessig - konsequent kommen XML-Tools zum Einsatz. Die
|    muessen wir nicht selber entwickeln, die gibt's auf dem freien
|    Markt, und jeder XML-Kenner, also jeder, kann damit umgehen.

zwar nicht jeder, aber jeder Browser (ausser Netscape 4.7., der
auf den Rechnern in Deutschen Bibliotheken allerdings wohl im
BIOS eingebrannt ist)


| Gewiss, ein Datensatz braucht dann mehr Platz und die Verarbeitung
| etwas laenger, z.B. die Indexierung, aber schon der ganz normale
| Aldi-PC fuer 999 EUR hat heute 160 GB und  3 MHz, also was soll's!
| Dann reicht die Zeit zum Indexieren wieder fuer eine Kaffeepause oder
| einen Kloenschnack, wie frueher.

apropos: Ich habe Hinweise darauf, dass INDEX.EXE von Version 13
auf Datenbanken mit v13-Parametern ca. 3mal schneller ist als
INDEX.EXE von Version 22 mit denselben Parametern. Werden Sie
schon des laengeren von der Kaffeeindustrie gesponsort?


| Und wie sieht dann ein allegro-Datensatz aus?
| Bisher haben wir, unglaublich sproede und sich der Intuition des
| Betrachters verschliessend, so etwas wie dieses:
|
| #00 654321
| #20 Was können wir wissen?
| #30aNA PH
| #31 Evolutionäre Erkenntnistheorie
| #40 Vollmer, Gerhard
| #74 Stuttgart
| #75 Hirzel
| #76 1985-
| #77 Bd.1.2.
| #01 1
| #20 ¬Die¬ Natur der Erkenntnis : Beiträge zur Evolutionären
Erkenntnistheorie
| #25 Mit einem Geleitw. v. Konrad Lorenz
| #76 1992
| #77 337 S.
| #87 3-7776-0403-8
| #90 2647-3611
| #01 2=Bd. 2
| #20 ¬Die¬ Erkenntnis der Natur : Beiträge zur modernen Naturphilosophie
| #77 350 S.
| #87 3-7776-0404-6
| #90 2650-9705
|
| Daraus wird durch "xml" auf einmal transparenter Klartext:
|
| <?xml version="1.0" encoding="iso-8859-1" ?>
| <#allegro-datensatz>
|    <#identnummer>a12345</#identnummer>
|    <#eigner sigel="84">Universitätsbibliothek Braunschweig</#eigner>
| <#hauptsatz>
|    <#titel>Was können wir wissen?</#titel>
|    <#sachgruppe>NA</#sachgruppe>
|    <#sachgruppe>PH</#sachgruppe>
|    <#verfasser>
|        <#vorname>Gerhard</#vorname>
|        <#nachname>Vollmer</#nachname>
|    </#verfasser>
|    <#schlagwort system="swd">Evolutionäre Erkenntnistheorie</#schlagwort>
|    <#impressum>
|       <#erscheinungsort>Stuttgart</#erscheinungsort>
|       <#verlag>Hirzel</#verlag>
|    </#impressum>
|    <#erscheinungsjahr typ="offen">1985-</#erscheinungsjahr>
|    <#umfang><#baende>Bd.1.2.</#baende></#umfang>
| </#hauptsatz>
| <#untersatz level="1">
|    <#bandnummer>1</#bandnummer>
|    <#sortierfaehige-bandnummer>001</#sortierfaehige-bandnummer>
|    <#titel>
|      <#hauptteil><#nichtsort>Die </#nichtsort>Natur der
Erkenntnis</#hauptteil>
|      <#zusatz>Beiträge zur Evolutionären Erkenntnistheorie</#zusatz>
|      <#ergaenzung>Mit einem Geleitw. v. Konrad Lorenz</#ergaenzung>
|    </#titel>
|    <#erscheinungsjahr>1992</#erscheinungsjahr>
|    <#umfang>337 S.</#umfang>
|    <#isbn typ="alt">3-7776-0403-8</#isbn>
|    <#signatur typ="magazin">2647-3611</#signatur>
| </#untersatz>
| <#untersatz level="1">
|    <#bandnummer>Bd. 2</#bandnummer>
|    <#sortierfaehige-bandnummer>002</#sortierfaehige-bandnummer>
|    <#titel>
|      <#hauptteil><#nichtsort>Die </#nichtsort>Erkenntnis der
Natur</#hauptteil>
|      <#zusatz>Beiträge zur modernen Naturphilosophie</#zusatz>
|    </#titel>
|    <#erscheinungsjahr>1985</#erscheinungsjahr>
|    <#umfang>350 S.</#umfang>
|    <#isbn typ="alt">3-7776-0404-6</#isbn>
|    <#signatur typ="magazin">2650-9705</#signatur>
| </#untersatz>
| </#allegro-datensatz>
|
|
| Natuerlich ist das eine etwas vereinfachte Fassung, damit das
| Grundkonzept deutlicher ins Auge sticht. Sie sehen: keine Nuemmerchen
| mehr, die man erst lernen muesste, keine Betulichkeiten mit
| speziellen Indikatoren, Interpunktionen und Unterfeld-Symboelchen.
| Keiner muss das manuell so eingeben, damit wir uns recht verstehen!
Dafuer gibt's
| XML-Editoren, z.B. XMLPAD von Onkel Bill, damit ist das ein
Vergnuegen. Nur das
| V25-XML-Schema wird gebraucht.

Her damit (fuer allegro-NRW und allegro-HANS habe ich das schon, fuer
MARC und MAB gibt es das auch, nur A.CFG fehlt noch)!

Das mit den Nuemmerchen ist natuerlich ein schon lange gepflegtes
Missverstaendnis von Ihnen, ein Datensatz in HANSXML sieht z.B. so aus
("comment" sind unwesentliche Kommentare, man beachte die Behandlung
von Verknuepfungen und Codierungen und von ueber v14-Ersetzungen
ererbten Teilfeldern):

<record recno="519" id="b303265" primkey="b303265">
~  <hansfield tag="003" comment="lokale Identnummer">b303265</hansfield>

~  <hansfield tag="004"
comment="Ersterfassungsdatum">20020410/16:14:13<subfield
~       code="O" comment="Bearbeiter">Keitel</subfield></hansfield>

~  <hansfield tag="005" comment="Satzart"><hanscode
~       expansion="Brief">b</hanscode></hansfield>

~  <hansfield tag="007" comment="Korrekturdatum">20030416/09:58:17<subfield
~       code="O" comment="Bearbeiter">Bloedorn</subfield></hansfield>

~  <hansfield tag="010" comment="Sigel">18</hansfield>

~  <hansfield tag="026" comment="Abrufzeichen =
Bearbeiterkürzel">kei</hansfield>

~  <hansfield tag="080" comment="Signatur">KN : 42 : 3</hansfield>

~  <hansfield tag="100" comment="beteiligte Person"><reference
toid="p2935">Niemeyer, August Hermann [1754-1828]<refsubfield
code="g">m</refsubfield></reference><subfield
~       code="i" comment="Funktion"><hanscode
~       expansion="Verfasser">v*</hanscode></subfield></hansfield>

~  <hansfield tag="100" repet="A" comment="beteiligte Person"><reference
toid="p9224">Winthem, Friedrich Wilhelm <nosort>von</nosort>
[1770-1848]<refsubfield code="g">m</refsubfield></reference><subfield
~       code="i" comment="Funktion"><hanscode
~       expansion="Adressat">a</hanscode></subfield></hansfield>

~  <hansfield tag="310" comment="Ansetzungstitel">Brief an Friedrich
Wilhelm von Winthem</hansfield>

~  <hansfield tag="331" comment="Sachtitel">Herrn von Winthem</hansfield>

~  <hansfield tag="335" comment="Zusatz">Hochgeehrtester Herr</hansfield>

~  <hansfield tag="359" comment="Vorlageform
Verfasserangabe">Niemeyer</hansfield>

~  <hansfield tag="410" comment="Entstehungsort">Halle</hansfield>

~  <hansfield tag="425" comment="Datierung">22.03.1821</hansfield>

~  <hansfield tag="433" comment="Umfang">1 e.Br.m.Umschl.</hansfield>

~  <hansfield tag="501" comment="Fußnote">Ort: Poststempel</hansfield>

~  <hansfield tag="703" comment="Formschlagwort = Formschlüssel. Gattung.
Herstellungstechnik">Familienbrief</hansfield>
</record>

Dieses Format hat sich als Austauschformat in der Praxis bereits
bewaehrt: Auch jemand, der nicht monatelang das HANS-Datenformat
studiert hat, kann *sofort* einen Eindruck bekommen
- - was in einem Datensatz drinsteht
- - was es bedeutet!


| Solche Datensaetze liegen dann, egal wie viele, als separate Dateien
| auf einem Verzeichnis des Webservers oder auch in einem
weitverzweigten Baum von
| sinnreich verschachtelten Unterverzeichnissen. Der Dateiname ist, Sie
erraten es,
| schlicht die Identnummer. Keine Steuerzeichen, keine hexadezimalen
internen
| Satznummern - alles ploetzlich viel einfacher, alles ploetzlich offen
und nicht
| mehr proprietaer im obskuren "Invisible Web" verborgen! Das hat den

Das hatten Sie schon einmal als Aprilscherz lancieren wollen. Es gibt
tatsaechlich Situationen, in denen man sagen kann "The File System is
the Database".


| Riesenvorteil, dass dann Google diese Dateien ganz leicht einsammeln und
| indexieren kann. Und weil sowieso jeder lieber googelt als a99t,
eruebrigt sich
| auf einmal die eigene Indexierung, sie wird sozusagen kostenfrei
outgesourct, und
| die Kaffeepause kann damit noch viel laenger werden. Ganz neu ist die
Idee nicht,
| aber erst jetzt konsequent zu Ende gedacht! (HBZ und OCLC machen schon
aehnliche
| Dinge, aber doch sehr halbherzig.)
| Ein schlichtes JavaScriptchen holt dann den per Google gefundenen
Datensatz in
| den XML-Editor eigener Wahl. Das ganze Record-Management entfaellt,
das macht ja
| dann das Dateisystem. Exportieren? Das geht mit dem viel leichteren
XSLT. Und
| FLEX? Muss auch nicht mehr gelernt werden. Was man davon noch braucht,
kann
| ebenfalls XSLT oder aber JavaScript uebernehmen.

s/oder/und/


| "Aber", fragen die ganz eingefleischten allegrologen, "was bleibt von
| 'allegro' dann noch uebrig?" Erstens die Daten, nun aber viel besser
| verpackt, und zweitens das unverwechselbare # in den Tags, das hat
| sonst keiner! Dadurch bleibt die Sache auch dezent, denn wir vermeiden,
| sowas wie <allegro:titel> schreiben zu muessen, was denn doch unnoetig
| aufgeplustert wirken wuerde.

Hier haben Sie Ihre Hausaufgaben wohl noch nicht ganz fertig gemacht:

- - "#" ist kein "Letter" und daher in Elemementnamen nicht erlaubt

- - "allegro:" waere ein Namespace-Praefix, das ist in der einfachen, von
~  Ihnen beschriebenen Situation implizit durch die Angabe eines
~  Attributs xmlns="http://www.allegro-c.de/a-cfg-v25-version-0.xsd"


| Man wird verstehen, dass so viele Vorteile ihren Preis haben muessen.
| Ganz genau steht's noch nicht fest, aber legen Sie fuer V25 schon
| mal etwas mehr auf die Seite...

aber verlieren Sie das Bosmann-Urteil nicht aus dem Auge!

viele Gruesse
Thomas Berger
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.3-nr1 (Windows XP)
Comment: Using GnuPG with Thunderbird - http://enigmail.mozdev.org

iD8DBQFAa8ekENVh3bB0lwMRAq7dAJ0RBlasV3F2yWOKzdes2CIo/tCoEwCguEOO
Jwab/9cVLuvGbnKnIIYzxN8=
=y8i9
-----END PGP SIGNATURE-----




Mehr Informationen über die Mailingliste Allegro