F: Wie mache ich einen Verbundkatalog?
Thomas Berger
ThB.com at t-online.de
Mi Jun 11 10:24:00 CEST 1997
Lieber Herr Allers,
nur kurze Anmerkungen zu Ihrem Verbundprojekt:
* 51 Avanti-Server brauchen Sie nicht: ein AVANTI-W -Server
kann viele Datenbanken abfragen.
* Ob 51 Datenbanken oder nur eine wuerde ich nicht von
Platzueberlegungen abhaengig machen: .ADX und .STL etc.
nehmen so viel Platz weg, dass doppeltes Datenaufkommen
in den .ALD vielleicht nicht so schlimm ist.
* Wichtig koennte sein, wie gut sich die Einzelbestaende
ueberhaupt zusammenfuehren lassen: Wenn ja, gewinnt die
zusammengefuehrte und Dublettenbereinigte Verbunddatenbank
an Wichtigkeit, wenn nein, sind die Einzelbestaende
interessanter
* Da sie mit acwww25 arbeiten werden, haben Sie viele
interessante Moeglichkeiten, gefundene (Roh-)Registeraus-
schnitte mit perl zu ueberarbeiten, bevor Sie sie dem Benutzer
praesentieren.
* Auch mit nur einer grossen Datenbank und Restriktionen
muessten Sie fast alle Probleme loesen koennen. Fuer
die Registerausschnitte fallen mir zwei Moeglichkeiten
ein:
1) Alle gefundenen Indexeintraege von acwww25 aus
mit der .RES abgleichen und ggfls. noch einmal einen
weiteren Indexabschnitt anfordern. (Nachteil: Heuristik.
Es ist nicht klar, wieviel Rechenzeit die Bereitstellung
einer Registerseite kostet)
2) Alle Registereintraege doppelt produzieren: Einmal
mit Praefix 00 fuer Gesamtkatalog und einmal mit
Praefix nn fuer die Teilbestandsnummer. acwww25
muss dann wissen, welche es holt. (Nachteil: .API
muss massiv ueberarbeitet werden, zusammenfuehren
von Titelsaetzen aus verschiedener Provenienz wird
sehr schwierig, da ggfls zu viele Schluessel erzeugt
werden)
3) Alle Registereintraege mit Liste der Provenienzen als
Postfix produzieren: Ist aehnlich (1), nur schneller.
Weitere Indexabschnitte muessen aber nicht nur deswegen
angefordert werden, weil einige wegfallen, sondern vor
allem auch, weil andere zusammengefasst werden muessen.
Vorteil: (1) und (3) sind die einzige Loesung, die auch
einfach eine Suche in "6 aus 49" erlaubt.
4) Umgekehrung von 2): Simulation der Grossdatenbank: Stets
50 Recherchen abschicken und die Ergebnisse ineinander-
sortieren. Nachteil: Der Rechenaufwand ist immens, aber
kalkulierbar.
Diese Moeglichkeiten und die durchaus erwaegenswerte der
51 Datenbanken sollten jeweils auch daraufhin beurteilt
werden, ob ausser "alle" und "exakt eine" auch evtl. eine
Suche nach einer (regional oder inhaltlich bestimmten)
Kombination von Teilbestaenden moeglich sein soll.
Wenn ich mich recht an die Darmstaedter Loesung erinnere,
werden dort stets einzelne Datenbanken durchsucht, allerdings
wohl parallel.
Viele Gruesse
Thomas Berger
Mehr Informationen über die Mailingliste Allegro