XML-Einfuehrung

Thomas Berger ThB at gymel.com
Mo Apr 5 10:10:37 CEST 2004


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg,

| Die ueberaus wohlwollende Resonanz auf unsere XML-Ankuendigung gibt
Veranlassung,
| einen Text schon jetzt freizugeben, der eigentlich fuer V25 noch in
der Schublade
| bleiben sollte:
|    http://www.allegro-c.de/axml.htm
|
| Wenn die Umlaute (im IE) falsch aussehen, stellen Sie ein:
|    "Ansicht / Codierung / Unicode (UTF-8)"

Sieht auch in Mozilla falsch aus. Hier ist Ihr Webserver nicht gut
eingestellt ("AddDefaultCharacterSet=On" scheint da vorzuliegen).


| Damit kann man sich schon mal ein Bild machen, was denn nun der wahre
Kern
| gewesen ist in der XML-Verlautbarung vom 1.4.
| Der Text beginnt mit einer Kuerzest-Einfuehrung in XML und beschreibt
dann die
| beabsichtigte Loesung.

zu den "subjektiven Anmerkungen":
|>>
Und wenn XML es zulieÃxe, statt der betulichen Wiederholung des Tags am
Feldende so etwas wie </> zu schreiben, würde auch einiges gespart, und
zwar bei jeder XML-Anwendung
<<<

SGML laesst so etwas zu. Beim Design von XML wurde hingegen Wert darauf
gelegt, dass Dokumente auch ohne DTD oder mitgeliefertes in anderen
Sprachen definiertes Schema zumindest "wohlgeformt" sein sollen. Daher
sind XML-Daten viel expliziter als SGML-Daten sein koennten (aber nicht
muessen).

Daher nennt die LoC die "datafields" und "controlfields" auch lieber
nicht "df" und "cf": Ausgeschrieben ist es viel expliziter und ein
unbedarfter Betrachter bekommt eine Ahnung von dem, was gemeint sein
koennte, ohne dass er auf die DTD und hoffentlich darin befindliche
Kommentare angewiesen ist.

Die *interne* Repraesentation (nach dem Parsen) ist vermutlich bei
jedem XML-Werkzeug viel kompakter, allerdings trotzdem umfangreicher,
weil zu jedem Element auch noch ein "Namespace" gehoert, auch wenn er in
der Quelle nicht explizit ist. [Eine Namespace-Deklaration wird das von
allegro produzierte XML hoffentlich auch haben, wegen der
CFG-induzierten Automatismen sollte diese am besten aus Namen und
Datumsstempel der benutzten CFG-Datei gebildet werden!]


| Der Befehl "xml" wird vermutlich sogar schon in V24.4 verfuegbar sein,
wenn die
| betr. Unterabteilung es bis dahin noch schafft.
|
| Zur Illustration: eine von 4 moeglichen Strukturen, die automatisch
herauskommen
| koennen (ohne Parametrierung!), waere diese:
| ("lb" steht fuer "label" und wird aus der CFG entnommen)
|
| <feld nr="00" lb="IdNr">875208</feld>
| <feld nr="20" lb="Titel">All's well that ends well</feld>

Hier gibt es strenggenommen keinen Grund, "'" und '"' zu escapen
(in Attributwerten muss man da mehr aufpassen)

| <feld nr="85" lb="Serie"><ns>The </ns>New Cambridge Shakespeare</feld>

nicht lieber: "<ns>The</ns> New Cambridge Shakespeare"? Das ist besser
lesbar und macht klar, dass es sich um ein Nichtsortier-Wort handelt.


viele Gruesse
Thomas Berger
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.3-nr1 (Windows XP)
Comment: Using GnuPG with Thunderbird - http://enigmail.mozdev.org

iD8DBQFAcRR8ENVh3bB0lwMRAtmgAKCFcTzVroJMcLwlnFRV2GS0KoPFjQCfdvJ+
247rGXfkEb+BQRXd78hLMpU=
=iJPy
-----END PGP SIGNATURE-----




Mehr Informationen über die Mailingliste Allegro