[Allegro] B3KAT jetzt als allegro-Datenbank
Klaus Lehmann
lehmann_klaus at t-online.de
Mo Jan 9 21:02:25 CET 2012
Guten Tag [Frau/Herr] Bernhard Eversberg,
danke für Ihre Nachricht.
Am Montag, 9. Januar 2012 um 12:19 schrieben Sie mir.
Ihre Nachricht finden Sie am Ende dieser eMail.
so schnell geb' ich nicht auf.
> Am 09.01.2012 11:37, schrieb Klaus Lehmann:
>> diese xml-dateien sind sehr fremdartig auf den ersten blick. für
>> denjenigen, dem die allegrostruktur wie ein offenes buch erscheint,
>> ist alles an einem wohlgeordnetem platze, ... für den ist sie -die xml-struktur-
>> schwer zu verstehen.
....
> Ohne .aim, allein mit FLEX hat sich das machen lassen.
> Wie das prinzipiell geht, steht in vb212 (Zu finden über "v flex" unter
> "XML-Daten einlesen)
naja, eben nur "prinzipiell".
ich bin mal so vorgegangen:
C:\Schmutz\b3kat_beispieldatei3.xml hat eine überschrift:
enthalten sind: "http://www.loc.gov/MARC21/slim"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
der erste link bringt zu nix! haben die bayern das mit absicht
gemacht?
der zweite link bringt -augenscheinlich- nichts verwertbares.
wie gehts weiter?
brauchen wir nicht erstmal informationen über die "struktur".
auf der suche, in google, führt mich der pfad er (un)kenntnis zu
xmlstarlet.
versuchen wirs mit dem starlet von xml:
C:\Programme\xmlstarlet-1.3.0>xml el --help
XMLStarlet Toolkit: Display element structure of XML document
Usage: xml el [<options>] <xml-file>
where
<xml-file> - input XML document file name (stdin is used if missing)
<options> is one of:
-a - show attributes as well
-v - show attributes and their values
-u - print out sorted unique lines
-d<n> - print out sorted unique lines up to depth <n>
XMLStarlet is a command line toolkit to query/edit/check/transform
XML documents (for more information see http://xmlstar.sourceforge.net/)
C:\Programme\xmlstarlet-1.3.0>xml el -u b3kat_beispieldatei3.xml
marc:collection
marc:collection/marc:record
marc:collection/marc:record/marc:controlfield
marc:collection/marc:record/marc:datafield
marc:collection/marc:record/marc:datafield/marc:subfield
marc:collection/marc:record/marc:leader
C:\Programme\xmlstarlet-1.3.0>
mit dieser strukturauskunft gibts nicht mal einen blumentopp zu gewinnen.
also: ehe ich anfange, einen flex zu schreiben, muss ich wissen, worum
es geht. also: worum geht es?
h vb212 ist nicht der schlüssel dazu.
hilft http://www.loc.gov/standards/marcxml/ weiter?
> Der dazu geschriebene FLEX ist mit 3000 Byte nicht eben groß. Und es
kann bitte diese flex veröffentlicht werden?
für meinen teil: wenn ich vor einer praktischen anwendung sitze, komme
ich (oder andere) leichter den geheimnissen auf die spur....
> ging dann tatsächlich viel schneller, indem man bis zu 10 a30-Fenster
> öffnete und jedes davon auf eine der ueber 30 Dateien ansetzte. Raus
> kam dann jeweils eine .alg-Datei, die dann insgesamt indexiert
> wurden.
> Ein ausgesprochener Präzisionsimport, so ist zuzugeben, ist die Sache
> nicht, doch sind schon die Ausgangsdaten nicht danach. Wären sie nicht
> abgespeckt, die MARCXML-Dateien wären noch voluminöser ausgefallen.
woher wissen wir/Sie das?
wir kennen nicht die struktur dieser marcxml-dateien.
> B.E.
> _______________________________________________
> Allegro mailing list
> Allegro at biblio.tu-bs.de
> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro
weiterrätselnd....
ihr klaus lehmann
ps: mit notepad++ lassne sich !keine! 2gb-großen xml-dateien einlesen.
--
Mit freundlichen Grüßen,
Ihr Klaus Lehmann
* http://allegronet.de * eMail: allegronet at t-online.de * phone: 03528-452 807(fax 809) * mobil: 0171-953 7843
* allegronet.de * Klaus Lehmann * D-01454 Radeberg * Kleinwolmsdorfer Str. 37
* Software für zufriedene Bibliothekare: 1000x bewaehrt und ergiebig
* Bereits 4x allegro-utf8. Buchen Sie die allegro-Roadshow
* Yes we can. Only with allegro. Yes we do. Allways with allegro.
* Internetkataloge&WebHosting für Allegro-C
* 2011: Sponsor der Peter-Sodann-Bibliothek (Staucha)
Am Montag, 9. Januar 2012 um 12:19 schrieben Sie:
> Am 09.01.2012 11:37, schrieb Klaus Lehmann:
>>
>> diese xml-dateien sind sehr fremdartig auf den ersten blick. für
>> denjenigen, dem die allegrostruktur wie ein offenes buch erscheint,
>> ist alles an einem wohlgeordnetem platze, ... für den ist sie -die xml-struktur-
>> schwer zu verstehen.
> Wirklich fremdartig sind RDF-Dateien, eine Unterart von XML.
> Hier handelt es sich um relativ banales XML.
>>
>> wie haben sie das -genau- gemacht?
>> gibt es eine aim, die man vielleicht in das gesamtpaket einordnen
>> könnte?
> Ohne .aim, allein mit FLEX hat sich das machen lassen.
> Wie das prinzipiell geht, steht in vb212 (Zu finden über "v flex" unter
> "XML-Daten einlesen)
> Der dazu geschriebene FLEX ist mit 3000 Byte nicht eben groß. Und es
> ging dann tatsächlich viel schneller, indem man bis zu 10 a30-Fenster
> öffnete und jedes davon auf eine der ueber 30 Dateien ansetzte. Raus
> kam dann jeweils eine .alg-Datei, die dann insgesamt indexiert
> wurden.
> Ein ausgesprochener Präzisionsimport, so ist zuzugeben, ist die Sache
> nicht, doch sind schon die Ausgangsdaten nicht danach. Wären sie nicht
> abgespeckt, die MARCXML-Dateien wären noch voluminöser ausgefallen.
> B.E.
> _______________________________________________
> Allegro mailing list
> Allegro at biblio.tu-bs.de
> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro
Mehr Informationen über die Mailingliste Allegro