F: Avanti-x

Cord Veltkamp ve at buch.biblio.etc.tu-bs.de
Fr Aug 28 14:47:19 CEST 1998


Sehr geehrter Herr Siepmann, liebe Liste,

> 1. Avanti-x scheint Probleme zu haben, wenn in einem Suchbegriff ein 
> Semikolon vorkommt, wie es z.B. bei uns in Register 5 bei Serien der 
> Fall ist (in der Form Serientitel ; Zaehlung). Wenn ich eine 
> Suchfrage an den Server schicke wie z.B.:
> find |5tuebinger beitraege zur linguistik ; 17
> kommt als Antwort
> N: kein Ergebnis bei: |5tuebinger beitraege zur linguistik
> Das heisst ja wohl, dass beim Semikolon abgeschnitten wird.

Ja, das Semikolon ist in der Avanti-Sprache ein Befehlstrenner und hat damit 
die gleiche Bedeutung wie "neue Zeile". Wenn Sie aber den Suchbegriff in 
Anfuehrungszeichen einschliessen, dann funktioniert die Suche (sowohl qrix- 
als auch find-Befehl). Es ist aber darueberhinaus wichtig, dass Sie ein 
Leerzeichen zwischen die Registerbezeichnung und den Suchbegriff setzten.

Ich gebe ja zu, dass die Dokumentation unter Avanti-X nicht so gut aufbereitet 
ist wie unter Avanti-W. Und die Sache mit dem Semikolon ist wirklich kaum zu 
finden. Aber trotzdem will ich die Gelegenheit nutzen und die Unix-Anwender 
auf das oft uebersehene File "avanti.htm" hinweisen. Dort steht der Text der 
Windows-Hilfe-Datei als einfacher HTML-Text. Ich bemuehe mich auch, ihn 
aktuell zu halten.

> 2. gibt es Probleme bei grossen Treffermengen, naemlich wenn ein 
> Suchbegriff mehr als 32.000 Treffer erzielt. Dann funktionieren 
> naemlich kombinierte Suchen nicht richtig, da nur ein Teil der 
> Treffermenge fuer die Verknuepfung herangezogen wird (im Gegensatz 
> zu Presto, wo Verknuepfungen ja mit beliebig hohen Treffermengen 
> moeglich sind.

Dieser Vergleich stimmt nur bedingt. Auch Presto verweigert bei einer 
Verknuepfung den Dienst, wenn _zuerst_ nach dem Begriff mit der einen 
UEberlauf produzierenden Trefferanzahl gesucht wird. Es kommt dann eine 
Meldung und der erfahrene Benutzer sucht zuerst nach "Vereinigung" und dann 
nach "Deutschland".
Seit der Umstellung der Avanti-Suche auf die Reverse-Polish-Notation (RPN) 
gilt fuer Avanti eine obere Grenze von 32.000 Treffern fuer _jeden_ Suchterm. 
Eine Verknuepfung der Ergebnismengen findet erst nach der Suche statt. RPN 
loeste den vorher implementierten rekursiven Algorithmus ab, weil dieser bei 
komplexer Klammerung der Anfrage ueberfordert war. RPN hat damit keine 
Probleme.
Sicherlich kann man die Grenze erhoehen (wieweit?), aber nicht beliebig 
(Speicher ist immer knapp) und erst nach ausfuehrlichen Tests.

Als Sofortmassnahme empfehle ich den Einsatz von Restriktionen. Man 
koennte _vor_ der Suche eine Jahresrestriktion setzen, die nur die Titel der 
letzten X-Jahre beruecksichtigt (dies ist bei so grossen Ergebnismengen 
sowieso noetig). Falls dann sehr wenig Treffer zurueckkommen, lockert man 
die Restriktion (bzw. hebt sie auf) und fragt erneut. Das kostet aber natuerlich 
Rechenzeit.

Ausserdem kann man die Gefahr zu grosser Treffermengen auch schon bei der 
Indexierung der Aufnahmen reduzieren.

Viele Gruesse und ein schoenes Wochenende,
Cord Veltkamp


#####################################################################
    Cord Veltkamp                       University Library
    Allegro-C Group                     Universitaetsbibliothek
                                        Pockelsstr. 13
                                        D-38106 Braunschweig
    Email:                              Germany
    c.veltkamp at tu-bs.de                 Tel: +49- 531- 391- 5074
#####################################################################




Mehr Informationen über die Mailingliste Allegro