Wer braucht denn Web-Kataloge?
Thomas Berger
ThB.com at t-online.de
Sa Apr 1 11:55:55 CEST 2000
Bernhard Eversberg wrote:
>
> AltaVista als Zentralkatalog!
...
> Wir wollen doch alle, dass die Welt unsere ausgesuchten Bestaende zur
> Kenntnis nimmt! Das Aufsetzen einer "avanti"-Datenbank ist aber nun wirklich
> kein Sonntagsspaziergang, von Z39.50 gar nicht zu reden, und selbst wenn
> man sowas macht, muss man ja das Publikum immer noch anlocken. Weit besser
> ist doch, umgekehrt, alles so aufzubereiten, dass die Suchmaschinen, die ja
> periodisch einen Gatherer, Spider, Harvester oder Grabbler vorbeischicken,
> unsere Katalogisate mundgerecht vorfinden und dann indexieren! Dann koennte
> man sich zuruecklehnen:
> Altavista oder das neuere FAST (www.alltheweb.com) benutzt ja jeder, daher
> wird dann auch jeder unsere Buecher zwanglos auf diese beliebte Weise
> finden. Dann heisst es nur noch:
> "Web-Katalog? Schauen Sie bei AltaVista nach, da sind unsere Bücher alle
> drin! DAS ist unser Katalog!" Und wenn alle mitmachen, ist es DER
> Zentralkatalog.
Das ist aber wirklich auch schon ein alter Hut [AH (TM)].
Gerade gestern suchte ich Informationen zu einigen
Sozialwissenschaftlern ueber Netscape und 80 - 90% der
Treffer waren Seiten von amazon.de und einem anderen
Online-Buchhandel.
Sie muessen also schon noch einen draufsetzen, wie es
aber die Mailinglisten-Archive schon laengst vorgemacht
haben: Genau wie ein Haufen Karteikarten keinen Katalog
ausmacht, fehlt ja noch das in-den-Zusammenhang-bringen
der Informationen: Also nicht nur Einzeldateien, sondern
Inhaltsverzeichnisdateien, sortiert nach Verfasser,
Titel, Sachgruppe und Erscheinungstermin, die jeweils
Links auf die Einzelkatalogisate enthalten. Die Links
und Link-Texte muessen natuerlich noch viel Information
des Zielsatzes enthalten.
Vorschlag also (und auch dies habe ich vor Jahren
einmal als "Schnittstelle zu MS Access" realisiert):
Mittels QRIX alle Allegro-Register herausexportieren
und zu Link-Tabellen auf die Saetze machen. Wegen
Bandbreiten- und Handlingproblemen sollte dann
allerdings pro Caption jeweils ein einziges Dokument
erzeugt werden, zu lange Dokumente werden ja
auch von den Volltextsuchmaschinen nicht entsprechend
gewuerdigt.
Hierzu fehlen nur zwei Punkte:
- xqrix: (Weitergedachtes qrix title von avanti)
Zu jedem Indexeintrag werden die zugehoerigen
Datensaetze nicht als Kurzzeile, sondern per
Parameterdatei formatiert ausgegeben
- Integration in die Flex-Sprache: Nicht nur
der Datensatz muss als RDF exportiert werden,
sondern die xqrix-Registerdokumente muessen
ebenfalls aktualisiert werden
Als Erweiterungen fuer die naechsten Allegro-Versionen
(allegro-NG fuer Next Generation) bietet sich dann
an, diese Linklisten automatisch nach PDF zu
konvertieren: Dieses Format bietet ja ebenfalls
Hyperlinks und die moderneren Suchmaschinen
koennen auch solche Dokumente durchsuchen. Im
Hinblick auf Langzeitarchivierbarkeit und
Vorlagentreue ist PDF aber reinem HTML mindestens
ebenbuertig.
Ein anderes allegro-Problem muss ja auch mittelfristig
geloest werden: Faircom's C-tree ist ja recht alt,
aktuell ist D-tree von derselben Firma. F-tree (TM),
mit der revolutionaeren File-System-Tree-Architektur
kann allegro wieder an die aktuellen Trends anschliessen:
Jeder Indexeintrag ist dann nicht mehr eine verrauschte
Bytefolge in der .cDX-Datei, sondern ein eigenstaendiges
XML/RDF-Dokument mit Links auf den Rest. Im Hinblick
auf das oben geschilderte Catalogue Advance Publishing
Prior to Expected Search terms (CAPPES (TM)) entfallen
dann hier die Konvertierungsschritte. Ausserdem ist
damit dann groessere Abwaertskompatibilitaet zu dem
gerade unter allegrologen beliebten X-tree wiederhergestellt.
viele Gruesse
Thomas Berger
Mehr Informationen über die Mailingliste Allegro