[Allegro] Vb.296: MARC-Export verbessert / dispex.flx : Export-Parametern visuell testen

Bernhard Eversberg b-eversberg at gmx.de
Mo Jun 11 08:45:30 CEST 2018


Verlautbarung 296 zur allegro-Entwicklung                    2018-06-11
-----------------------------------------

INHALT:
MARC-Export : Mehrteiler kommen nun besser raus
dispex.flx  : Visuelle Kontrolle zum Testen von Export-Parametern
GBV-Import  : RVK wird uebernommen (srugbv.flx)
o-bots.flx  : Bestellungen ohne Titelsatz finden

Ein neues Gesamtpaket lohnt noch nicht. Es sind nur wenige Dateien,
die inzwischen veraendert wurden. Man holt sie sich leicht und schnell
mit X gf dateiname: (Die ersten drei werden in dieser Vb genauer
beschrieben, sie sind besonders wichtig.)
Programme wurden keine veraendert.

marctxt.apr : Export im MARC-Textformat: Praxiserfahrungen eingebracht
dispex.flx  : NEU: Visualisierung von Exporten in a99
o-bots.flx  : NEU: Verwaiste ORDER-Bestellsaetze (ohne Titel) finden

Ferner Verbesserungen einiger Details in folgenden Dateien:
(alle ebenfalls mit  X gf  zugaenglich)

srugbv.flx  : GBV-Direkt-Fremddatenübernahme
$a.cfg      : #32R wurde eingebaut fuer RVK  (s.u.)
cat.api     : neu #89W f. WorldCat-Id ->|9 Wnummer
dnb.flx     : DNB-Direkt OCLC-Nr. kommt in #89O
quick.vw    : MARC-Anzeigefunktion mit dispex.flx eingefuegt
marc.rtf    : Kurzdoku MARC21


MARC-Export : Mehrteiler kommen nun besser raus
-----------------------------------------------

Ins naechste Gesamtpaket kommen MARC-Exportparameter in zwei Varianten:

marctxt2017.apr  :  Letzte des Jahres 2017: 19.12., intern 20.10.2017

marctxt.apr : Ueberarbeitete Variante mit vielen Verbesserungen

Die erstere, aeltere wird nur vorsichtshalber noch vorgehalten, falls
jemand Gruende hat, damit weiter arbeiten zu wollen. Etwa weil man
seit Jahr und Tag damit gut zurechtkommt und jedem Wechsel gerne
aus dem Wege geht (Devise "Never change a running system").
Diese aeltere Datei kann man abholen mit  X gf marctxt2017.apr,
Datum: 19.12.2017. War aber im GP von V38.1 mit drin, nur unter
dem Namen marctxt.apr.

Die neuere Datei liegt also nun unter dem alten Namen vor: marctxt.apr.
Sie treibt vor allem mehr Aufwand mit mehrteiligen Datensaetzen, und
zwar hierarchischen einer- und verknuepften andererseits. Denn es
hatte sich gezeigt, dass die Praxis der Handhabung mehrteiliger Werke
ein weites Feld ist. Nicht selten wurden in derselben Datenbank sowohl
hierarchische als auch verknuepfte Saetze gemacht, wobei die Frage, was
man denn reinschreibt bzw. nicht reinschreibt in die Haupt- bzw.
Untersaetze facettenreiche Antworten gefunden hat ... 
Die neue Variante versucht, Haupt- wie auch Untersaetze zu selb-
staendigen MARC-Saetzen zu machen, wobei die einen wie auch die anderen
aus den jeweils anderen bzw. einen um wichtige Elemente ergaenzt werden,
die fehlen, wie etwa Signaturen oder Erscheinungsjahre oder auch
Titel etc. Das machte bei der allegro-Datenbankstruktur nichts aus,
weil ja immer der vollstaendige Satz oder wenigstens zum Untersatz
auch der Hauptsatz automatisch gezeigt wurde (bewirkt durch die
Anzeigeparameter d-wrtf.apr oder auch d-krtf.apt) und weil es ja
sogar die "satzuebergreifende Suche" gibt (cat.api). Solche Dinge
kennt die MARC-Welt nicht, also muss man die Saetze gegenseitig
ergaenzen. ("Redundanz" ist längst ein Unwort.)
Der Komplikationen war fast kein Ende, aber am Ende wurde eine schon
sehr historisch gewachsene und nicht sehr kleine Datenbank exportiert 
und von VuFind beschwerdefrei verwurstet. WorldCat hatte noch Monita,
an denen u.U. hier und dort noch was getan werden kann.
Daneben gibt es aber noch etliche andere Kleinigkeiten, die geaendert 
wurden. Wichtiges Detail f. VuFind:
Hauptsaetze erhalten fuer VuFind ein lokales Feld, das so aussieht:
=951  \\$aMC    (WorldCat dagegen beachtet das wohl nicht)

Bewaehrungsproben in Umgebungen wie WorldCat oder VuFind/beluga sind
inzwischen bestanden worden, man wagt sich also nicht auf dünnes Eis.
Es sei denn, man hat vor Ort noch eigene Extravaganzen, die der
Beruecksichtigung beduerfen.

Wichtiger Hinweis:
Kollege Lehmann hat eine eigene Version erstellt, die erstens besser
pflegbar ist (weil uebersichtlicher) und zweitens viele Besonderheiten
jedenfalls seiner eigenen Klientel besser nach MARC rueberbringen kann.
Einziger Haken: Er gibt die Datei nicht kostenlos ab - verstaendlich,
denn es war eine Menge Arbeit.
Wer also will und das Geld hat, kannn waehlen! Wer das Geld nicht hat,
soll wenigstens mit der Standardversion, die zum Paket gehoert, auch
moeglichst gut bedient werden. Was genau die Unterschiede sind, kann
praezise nur Kollege Lehmann beantworten. Man wende sich folglich 
bei Interesse vertrauensvoll an ihn.


NEU: dispex.flx
MARC-Export : Visuelle Kontrolle - Wie testet man die Parameter?
----------------------------------------------------------------

Wer in einer Parameterdatei wie marctxt.apr herumschraubt, moechte die
Aenderungen leicht und schnell testen koennen. Dazu folgende Tips.
Das Einfachste ist, und so machte man das bisher gerne, in a99 
folgenden Befehl zu geben:
x dis p marctxt
Dann wird die Datei marctxt.apr als Anzeigeparameter geladen und sofort
sieht man jeden Datensatz so, wie er exportiert wird. 
Ohne diese Moeglichkeit muss man nach jeder Aenderung Daten in eine
Datei exportieren und diese in einem Editor in Augenschein nehmen, Das 
ist ermuedend umstaendlich und zeitraubend.
Aber es gibt ein AERGERLICHES Problem, wenn man genau hinschaut: In den 
MARC-Daten des Formats .mrk (welches marctxt.apr erzeugt) kommt oft das 
Zeichen \ vor, der Backslash. Er steht für ein Leerzeichen und wird bei
der nachfolgenden Wandlung von .mrk in .mrc durch ein solches ersetzt.
Der \ hat leider die Wirkung, dass er in der a99-Anzeige zusammen mit 
einem oder mehreren nachfolgenden Zeichen gar nicht sichtbar wird. Wenn
im Text \\ vorkommt, doppelt also, dann allerdings erscheint ein \, 
aber NUR einer. Es ist ein Aergernis des RTF-Textformats, dass man 
man das nicht aendern kann.
UNSCHOEN ist ferner, dass in der MARC-Anzeige die Sonderzeichen nicht
korrekt sichtbar werden - denn sie sind in UTF-8 codiert! 
Auf Abhilfe wurde gesonnen und eine Loesung gefunden. Eine Loesung 
nicht nur fuer MARC-, sondern auch fuer ganz andere Exporte.
Ein FLEX namens  dispex.flx  wurde geschrieben, abzuholen mit
  X gf dispex.flx
(Name leitet sich ab von "display export")

So arbeitet man damit:

0. Den oben angegebenen Befehl  x dis p marctxt  braucht man nicht!
   Sondern es geht so:

1. Eingeben:  X dispex
   (oder Alt+4 und aus der Quick-Liste "Anzeige ... in MARC21" waehlen)
   Damit wird der Befehl  X dispex marctxt  auf den Button Alt+9 gelegt
   und ist einsatzbereit.
   Dieser Schritt ist nur am Beginn der Sitzung einmal noetig und 
   bleibt dann bis zum Ausstieg oder Neubelegung von #uX9 gueltig.
  
   ! Besser noch: Es klappt auch mit Lehmanns renovierter Variante!
     Falls die z.B.  lehmarc.apr  heisst, dann eingeben:
     X dispex lehmarc

2. Beispiel-Datensaetze anzeigen lassen und jeweils Alt+9 betaetigen.
   Dann wird der Satz korrekt in MARC sichtbar. Auch die Sonderzeichen.

3. Nun kann man Aenderungen in der  marctxt.apr  machen und speichern.
   Dann sofort wieder Schritt 2 zum Testen. 

4. Mit F5 ist die normale Anzeige wieder da. (Statt dass man dazu erst
   wieder die normalen Anzeigeparameter laden muesste, wie das bei der
   alten Methode war!)

Wie es technisch gesehen funktioniert? Das steht als Kommentar in  
der Datei dispex.flx  drin.
Wer auch nur wenige Aenderungen machen will, wird feststellen, dass
diese Methode sich sehr lohnt. Das wird sofort die Frage ausloesen:
Kann man den FLEX auch fuer noch andere Exportparameter einsetzen?
Ja, kann man. Sagen wir, die Datei heisst abc.apr. Dann im Schritt 1
eingeben:  X dispex abc
Dann wird eben abc.apr genommen statt marctest.apr. Wenn jedoch
abc.apr mit ganz eigenen Steuerzeichen operiert, oder z.B. den Code 0
verwendet (z.B. Exporte im .alg-Format), dann geht's nicht.


GBV-Import: RVK wird uebernommen
--------------------------------
Klassifikationsdaten wurde bislang nicht uebernommen. Die weitverbreitete
Regensburger Verbundklassifikation RVK wurde von einem Anwender 
gewuenscht. Sie gehoert nach der Logik von $a.cfg in #32R.
Der dazu noetige Abschnitt wurde in srugbv.flx eingebaut. Wer ihn
nicht wuenscht, aktiviert nur die Zeile
 end
direkt vor dem RVK-Abschnitt.
Notwendig war dazu auch, fuer #32 in der $a.cfg den Buchstaben R zu 
erlauben. Die Zeile dafuer sieht jetzt so aus:

#32"FremdNotation"$MABDLMNRZ

Moeglich waere auch

#32

dann ist jeder Buchstabe erlaubt.


NEU: o-bots.flx : Bestellungen ohne Titelsatz finden
----------------------------------------------------
Passieren kann es schon mal, daß ein bestelltes Buch spaeter beim 
Katalogisieren eine andere #00 bekommt. Dann ist die Verbindung zum
Bestellsatz weg! Denn der verlinkt sich mit dem Titelsatz ueber dessen
#00-Nummer, und zwar in  #9DA$T... 
Wie findet man solche verwaisten Bestellsaetze? Mit dem neuen FLEX
namens  o-bots.flx  ("Bestellungen ohne Titelsatz").

Abholen mit   X gf o-bots.flx
Starten mit   X o-bots

Und was passiert dann?
Der FLEX legt eine Ergebnismenge der gefundenen Bestellsätze an,
Jeder hat (hoffentlich) eine Zugangsnummer in #9DB$z (zu sehen mit F5
oder im Formular "Inventarisierung"). Mit Hilfe dieser Nummer sollte 
man den Titel dann im "Zugangsbuch" finden koennen, damit dann auch in
der Datenbank. Die #00-Nummer dann kopieren und in den Bestellsatz
im Feld #9DA$T eintragen, und natürlich weg mit der falschen Nummer an
der Stelle.
Wenn's aber keine Zugangsnummer gibt, kann hoffentlich noch das
Bestelldatum in #9DA$B helfen!?

Tip: Wenn man einen Bestellsatz vor sich sieht, eingeben: X cfga
Dann sieht man alle Felder und Unterfelder mit Bedeutung aufgelistet.
Das geht uebrigen bei allen Datensaetzen.




Mehr Informationen über die Mailingliste Allegro