Goettingen / Wunschzettel f. Version 15

Thomas Berger thomas at mpim-bonn.mpg.de
Do Jun 8 21:03:25 CEST 1995


Liebe AllegrologInnen,

    [Erst die Einleitung, der Wunschzettel kommt auf der n"achsten Seite]

In Goettingen fand ich vor allem die Berichte betreffs der kommenden PND
interessant (alles, was im weiteren Sinne mit 'Online' zu tun hatte,
war vielleicht in einem gewissen Sinne interessant, andererseits auch
deutlich nur eine Reaktion auf das, was jeder Bibliothekar, der die
Chance hatte, seinen Computer zu beeinflussen, schon immer getan hat -
wenn er es sich getraut hat). Den Vortrag 'haben HTML-Kataloge eine
Chance in Deutschland' habe ich leider nicht geh"ort, vielleicht kann
jemand dar"uber berichten?

Alles in allem scheint mir die neue PND eine brauchbare Sache zu sein,
und notwendig ist sie sowieso immer mehr. Auff"allig ist, dass der Trend
zur st"arkeren Nutzung von Normdateien nicht nur da ist, sondern auch
allerseits bereits bemerkt wurde. Ich denke, dass wir uns bald mit der
Tatsache auseinandersetzen m"ussen, dass
1.) ein Normdatensatz Bezug auf andere Normdatens"atze nimmt
    (Beispiele: Personen- und Namensnormierungsrecords innerhalb der PND
                Affiliation (d.h. GKD-Verweis in der PND)
                Personenkennzeichnung in EST-Stamms"atzen
     aber auch: 'Verschlagwortung von Stamms"atzen, wie z.B. Zuordnung
                von geographischen und zeitlichen Schlagworten zu Personen-
                norms"atzen
2.) ein Normdatensatz mehrere Ansetzungen enth"alt:
    Beispiel: Ein Satz der neuen PND enth"alt nicht nur die RAK-Ansetzung
    (plus (RNA) Individualisierung), sondern ggfls. ausserdem noch die
    RSWK-Ansetzung (an einer Vereinheitlichung wird nat"urlich gearbeitet)
    und ausserdem eine evtl. abweichende lokale Ansetzung und vielleicht 
    auch noch die LC-Authority-Record Ansetzung.
[Nur am Rande: Begr"ussenswert finde ich, dass die neue PND auf Ident-
nummern (bei den Tp-Records) verzichtet, da ja die Ansetzungen so individu-
alisiert sind, dass die Ansetzung (als Zeichenkette, also als Hexadezimal-
zahl oder wie auch immer) vollkommen ausreicht, den Satz zu identifizieren]

   [Jetzt kommt also mein Wunschzettel. Kommentare von allen sind erw"unscht.
    kleinere Punkte stehen ganz am Ende dieser Mail]

F"ur die sowieso n"otige Konsolidierung des V-14-Ersetzungsmechanismus
scheinen mir folgende Konsequenzen zwingend:
Ia) 'Schl"usselersetzungen im Inneren' m"ussen funktionieren (f. Kurztitel-
    anzeige, normierte (Unter-)Schlagworte, Verweisungen innerhalb eines
    Thesaurus, 'Verschlagwortung' von Stamms"atzen etc.
Ib) Schl"usselersetzungen d"urfen nicht auf eine Stelle in einem Register
    beschr"ankt sein. Personen kommen ja evtl. z. B. im Sachregister und
    im Formalregister vor (obwohl die meisten diese bestimmt zusammenfassen)
Ic) Ein Stammsatz muss mehrere Ersetzungsschl"ussel produzieren k"onnen (siehe
    2) oben). d.h. die Methode mit Pseudoschl"usseln (die nur f"ur einen
    Pseudoschl"ussel pro Satz funktionieren KANN), muss durch eine bessere
    ersetzt werden.
Id) Es sollte eine M"oglichkeit gefunden werden, Recherchen auf 'Sekund"ar-
    schlagworte' auszuweiten: Sucht man nach einem Geographikum, so kann man
    durch Einschalten von Assoziativit"at diejenigen Titel einbeziehen, deren
    Verfasser z.B. mit diesem Geograhpikum 'verschlagwortet' ist.
Ie) Zumindest '-' sollte innerhalb der Ersetzungsschl"ussel erlaubt sein.
    Diese sind ja meistens doch stark strukturiert, und sollten eigentlich
    fast immer folgende Informationen enthalten:
    Typ (Person, K"orperschft, EST, Schlagwort, Systematik, ...)
    Provenienz der ID (lokales K"urzel, das die numerische ID eindeutig macht
    Numerische ID
    'Variante' (siehe Ic)
    Beispiel:
    ppnd1234a    f"ur die RSWK-Ansetzung des PND-Satzes 1234
    Da w"are p-pnd-1234-a
    nicht nur f"ur Menschen, sondern auch f"ur Maschinen besser lesbar!
[Zu a-c werden P. Oliver Kaftan aus Aachen und ich innerhalb der n"achsten 
Zeit eine 'Machbarkeitsstudie' mit konkreten Vorschl"agen vorlegen]

Mit Id) und der letzten 'Verlautbarung der Entwicklungsabteilung' (#8), aber
auch mit Herrn Allers lauter Klage "uber die Unm"oglichkeit der Bildung
gewisser Suchbegriffe im Schnellzugriff h"angen folgende Vorschl"age zusammen,
die Trunkierung und Ergebnismengenbildung betreffen:
IIa) komfortablere Trunkierung: Trunkierung 'xyz' heisst dann:
     Trunkiere beim ersten 'z' hinter dem ersten 'z' hinter dem ersten 'x'
     Beispiel: '//': die ersten zwei Glieder einer Schlagwortkette werden 
                     angezeigt
               '--': ISBN's werden nach Verlagen zusammengefasst
IIb) Voreingestellte Trunkierung: (F"ur jedes Register separat spezifizierbar)
     Personen werden zwar nach M"oglichkeit individualisiert indexiert,
     diese Individualisierung wird aber standardm"assig nicht dargestellt,
     da trunkiert. Erst das Erweiterte Register oder ein explizites Aufheben
     der Trunkierung (Ebenfalls F7?) zeigt, dass es dort in Wirklichkeit 
     mehrere Schl"ussel gab.
IIc) Auch PRESTO sollte Ergebnismengen einlesen k"onnen, so wie QRIX sie seit
     neustem produziert und die Exportsprache sie jetzt komfortabel verar-
     beiten kann. Zusammen mit der Globalen Manipulation hat man dann die
     M"oglichkeit, mittels Volltextsuche Datens"atze zu selektieren und
     dann an der lebenden Datenbanken zu verarbeiten, ohne die Gefahr von 
     Datenverlusten, wie sie bei Selektion und Manipulation und erst an-
     schliessendem Neueinspielen mit UPDATE vorkommen k"onnen (es sei denn,
     man legt die Datenbank f"ur diese Zeit still).
IId) PRESTO sollte auch Ergebnismengen in dieser Form wegschreiben k"onnen.
     [Kann es zugegebenermassen, wenn man vorher den richtigen Export einstellt
      und durchf"uhrt]. Mit c) und d) zusammen kann man etwa eine m"uhsam
     erarbeitete Ergebnismenge, die noch nicht komplett manuell verarbeitet
     worden ist, f"ur den n"achsten Arbeitstag 'retten'.
IIe) PRESTO sollte einen Stack (Stapelspeicher) von Ergebnismengen (auf
     der Platte) anlegen und bearbeiten k"onnen. Bekanntlich sind Benutzer
     von HP-Taschenrechnern schneller als die von anderen, dies liegt an
     der umgekehrten Polnischen Notation (UPN). Bei dieser, auch Postfix-
     notation genannt, wird 3 <Enter> 5 + eingegeben, statt 3 + 5 =
     Klammerungen entfallen vollst"andig und man kann trotzdem alles berechnen.
     Mit dieser Postfixmethode kann ich also (mit Bin"aroperatoren) auch
     folgende Recherche durchf"uhren:
     (Stichwort bunt ODER farbig) UND (Stichwort Baum ODER Holz)
     N"amlich: 
     bunt / farbig /  <Push> Baum / Holz <Meta-+>
     liefert genau die gew"unschte Ergebnismenge.
     Mit dieser Methode l"asst sich jede - auch noch so komplizierte Operation
     mit Treffern und Ergebnismengen durchf"uhren, man braucht dazu nur die
     Stackverarbeitung und die zus"atzlichen (Benutzer-)Befehle
     <Push>, <Meta-/>, <Meta-+>, <Meta--> und <Vergessen>
     Die Frage ist nat"urlich berechtigt, ob das irgendjemand 'auf die Reihe
     kriegt'. Meine pers"onliche Ansicht ist, da"s der durchschnittliche
     Benutzer von den sogenannten 'Booleschen Operationen' sowieso "uber-
     fordert ist, egal ob in Postfix- oder Infix-Notation (letztere ist die,
     an die wir gew"ohnt sind). Selbst wenn er das Konzept begreift, verheddert
     er sich sp"atestens bei den Klammern. Damit ist meine Meinung etwa in
     der Mitte der H"arteskala angesiedelt, es gibt auch solche, die behaupten,
     dass Trunkierung den durchschnittlichen Benutzer "uberfordert.
     Aber: 
IIf) PRESTO sollte (parametrierbar) die Manipulation von Ergebnismengen
     (und die Kontrolle "uber den Stack von IIe) erm"oglichen. Damit (und
     mit einem geeigneten Thesaurus) ist es meiner Meinung nach recht einfach,
     die unter Id) beschriebene Ausweitung einer Recherche auf Oberbegriffe
     des Schlagwortes oder auf Sekund"arschlagworte der Person etc.
     durchzuf"uhren. Der Benutzer dr"uckt eine geeignete Taste und die
     'komplizierte' Bedienung unter IIe) erledigt die Parametrierung.

Bei IIf) fehlte also noch die geeignete Taste:
III) [Was bislang wohl nur "uber die c-Schnittstelle geht]: Es gibt - trotz
     langj"ahriger Anstrengungen der Entwickler - immer noch einige Tasten,
     die in bestimmten Kontexten keine Bedeutung haben. Mein Vorschlag:
     Tasten, mit denen weder das Programm noch die c-Schnittstelle (oder das
     aktuellen Zusatzmodul ORDER, REF, etc) etwas anfangen kann, werden als
     #u1 an eine bestimmte Sprungmarke "ubergeben (nicht die Tasten selber,
     sondern eher ihre ANSI-Codierung, die auch mitteilt, ob es <Alt>, <Shift>
     <Ctrl>, ... <Crtl>+<Shift>+<Alt> <Fn> gewesen ist.
     Und zwar wird beim Bet"atigen aus dem Index an eine Sprungmarke in der
     .cPI gesprungen, beim bet"atigen aus der Anzeige an eine Sprungmarke
     in der .cPR f"ur die Anzeige.
     Beim Aufruf aus dem Index stehen dann die gedr"uckte Taste und der
     aktuelle Indexbegriff (und Register) sowie nat"urlich die derzeitige
     Ergebnismenge zur Verf"ugung. Das sollte ausreichen, um die Ergebnis-
     menge auf die eine oder andere Art und Weise sinnvol zu manipulieren.
     [Auf diese Weise l"asst sich z.B. Linkstrunkierung simulieren, aber
     eventuell doch die sinnvolle Suche nach Zeitr"aumen, dazu dieser Tage
     vielleicht mehr].
     Beim Aufruf aus der Anzeige l"asst sich dieser Mechanismus z. B.
     benutzen, um eine neue Ergebnismenge, bestehend aus den Norms"atzen
     aller am aktuellen Titel beteiligten Personen und K"orperschaften
     zu bilden und den ersten Satz dieser Menge anzuzeigen. Oder Angaben
     zur Reihe. Oder Bildung einer Ergebnismenge mit allen Ausgaben 
     dieses Titels...

Miscellanea:
IV) Importsprache: Hilfreich w"are ein Befehl, der den ENDE-Zeiger vom 
    Ende her nach vorne verschiebt (vergleichbar mit 'T' bzw. 't' in der
    Exportsprache. Allerdings finde ich gleichzeitig, dass die Importsprache
    in Punkto M"achtigkeit und Universalit"at nicht mit der Exportsprache
    in Konkurrenz treten braucht: Die Feinbearbeitung kann ja immer mit
    dem (per -e -Parameter) nachgeschalteten Export gemacht werden.

V)  SRCH: Es w"are gut, beim Aufruf eine Datei angeben zu k"onnen, die
    den Infotext oberhalb des Eingabefeldes enth"alt (derzeit: UIF4).
    Ich produziere h"aufiger sortierte Listen, wo ich, da die Datens"atze
    beim ersten Export zerteilt werden, die Selektion erst beim zweiten
    Export (also nach dem Sortieren) eingeben kann. Typischerweise erinnere
    ich mich dann nicht mehr, ob ich #u1<19950101 oder #u2<950101 eingeben
    muss. "Uber (#40,goethe)-schiller hingegen haben alle schon genug gelernt.

VI) PRESTO: "Ubernahme von Schl"usseln in die gerade editierte Aufnahme sollte
    mit <Strg>+<Enter> (Statt <Enter> <Strg>+<Enter> wie bisher) machbar sein.

VII) In Hinblick auf PV und auf den Schl"usselersetzungsmechanismus stimmt
    es immer weniger, da"s sich die Daten stets aus den ALD-Dateien rekon-
    struieren lassen. Genauer: Die Aussage an sich stimmt zwar immer noch, 
    ist aber immer weniger von Belang, da die Fehlerm"oglichkeiten bei der 
    'Eingabe', der (halb-)automatischen Feldgenerierung also zum Zeitpunkt 
    der Eingabe oder Modifikation durch den Benutzer durch einen eventuell 
    inkonsistenten Index gewaltig und absolut unkontrollierbar sind. Es fehlt
    ein Tool, das "ahnlich wie QRIX (aber im Netzbetrieb) den Index Schl"ussel
    f"ur Schl"ussel durchsucht, den jeweils zugeh"origen Datensatz holt, 
    dessen Schl"ussel berechnet und dann herausfindet ob
    a) der urspr"ungliche Schl"ussel "uberhaupt auf diesen Satz zeigen darf
    und
    b) alle Schl"ussel, die dieser Satz produziert, tats"achlich vorhanden sind.
    Im Fall von Inkonsistenzen sollte dieses Programm wahlweise nur ein
    Protokoll ausgeben oder auch die Schl"ussel korrigieren.
    Mir ist klar, dass dieses Programm (wegen n"otiger Pausen) im Netzwerk-
    betrieb schon bei mittleren Datenbanken viele Stunden Laufzeit ben"otigt.
    Ich stelle mir aber vor, da"s dieses Programm nach M"oglichkeit sogar
    immer laufen sollte (ich weiss nat"urlich, dass keine Bibliothek einen
    PC f"ur solche Zwecke er"ubrigen kann, aber vielleicht ein DOS-Fenster
    unter Windows?): St"undlich soll es besonders heikle Stellen ("Ubernahme-
    und Ersetzungsschl"ussel) "uberpr"ufen, aber der Rest der Datenbank auch:
    Vielleicht jeden Tag ein anderes Register.
    Wie QRIX also sollte man diesem Tool einen Indexbereich als Aufrufparameter
    "ubergeben k"onnen.

VII) ASORT sollte eine Aufrufoption bekommen, die es erm"oglicht, dublette
    Zeilen auf eine zu reduzieren. 

Dies also meine Liste von Vorschl"agen. Sie ist ziemlich lang geworden und
vielleicht trotzdem in einigen Punkten nicht gen"ugend begr"undet. Ich kann
nat"urlich nicht erwarten, da"s irgendjemand das alles liest, aber vielleicht
manche von Ihnen wenigstens einen Teil.
Jedenfalls hoffe ich auf eine Diskussion.

[nicht in Goettingen geblieben]
Thomas Berger



Mehr Informationen über die Mailingliste Allegro