(Fwd) Re: u-Befehl, STOPWORT-Indexierung und 1e abwegige(?) Frage

thomas at mpim-bonn.mpg.de thomas at mpim-bonn.mpg.de
Do Mai 16 13:01:39 CEST 1996


Liebe Listenteilnehmer mit t-online als Provider:

Bitte benutzen Sie _nicht_ die Reply-Funktion, da in diesem
Fall Ihre Antwort die "Message-Id:" der Mail erhaelt, auf
die Sie antworten. Der Listprocessor hier am MPI haelt Ihre
Antwort dann fuer eine Dublette...
                                     Thomas Berger
The message is included below:
-----------------------------------------------------------------------------
Return-Path: <allers at t-online.de>
Date: Thu, 16 May 96 00:54 +0100
From: allers at t-online.de (Heinrich Allers)
X-Sender: 08974664017-0001 at t-online.de (Heinrich Allers)
Subject: Re: u-Befehl, STOPWORT-Indexierung und 1e abwegige(?) Frage

Am 15.May.1996 17:56:10 +0200 wurden von
Manfred Weichert (WEICHERT at sub1-hh.sub.uni-hamburg.de)
folgende Fragen aufgeworfen:

(Zu Frage 1 und 2 f"allt mir etwas ein; zu Frage 3 bleibe ich
eine Antwort schuldig!)

> ...
> 1. Der u-Befehl:
> In der Dok. steht etwa (in meinen Worten), dass uxy die
> Zeichenkette zwischen x und y aus dem Arbeitzstext entfernt.
> Wenn x=y scheint das nicht zu funktionieren.

Ich habe es eben mal versucht, und danach funktioniert
es: Die Anweisungszeile

#20 uaa

l"a"st z.B. aus dem Wort 'Shakespeares' im Titel tats"achlich bei
der Ausgabe 'Shres' werden!

> In der betr. d-1 steht z.B. u$$ und bewirkt, dass der Text _ab_
> dem _einzigen_ $-Zeichen in dieser Kategorie aus dem AT entfernt
> wird.
> Ist das so gewollt?

Wohl nicht.

> 2. Bei einem so stark registerorientierten Suchsystem wie allegro
> wuensche ich mir, dass der Benutzer im Register (dann wohl in allen
> Registern) die Stopworte findet mit einem entsprechenden Hinweis.
> ...
> Wie kann man das erreichen?

Z.B. so: einen Datensatz im Allegro-Format bauen, in den man in
eine ganz spezielle Kategorie, etwa in #2st (die nat"urlich in
der Konfigurationsdatei erg"anzt werden mu"s), alle Stoppworte
hintereinander schreibt, etwa durch Semikolon getrennt:

#2sta;ab;about;ad;after;al;alle;als;am;an;and;as....

und in die Indexparameterdatei dann folgenden Abschnitt
einbaut:

ak=2st";"+s
#-s
!u {"|1"} P{" IST STOPPWORT"}
#t{8}
!u {"|2"} P{" IST STOPPWORT"}
#t{8}
!u {"|3"} P{" IST STOPPWORT"}
#t{8}
..
..
..
#+#

und dann die ganze Datenbank unter Einschlu"s dieses Stoppwort-
datensatzes neu indexieren!

===> Achtung: diese L"osungsskizze habe ich nicht praktisch
     ausprobiert!

Der Code 8 soll die vielen Schl"ussel trennen, die f"ur (fast)
jedes der Register gew"unscht ist (es war doch der Code 8, der
diese Eigenschaft hatte, nicht wahr? Ich habe eben die News nicht
zur Hand).

Wenn man dann im Register nach Stoppw"ortern greift, wei"s man gleich,
warum keine Titel dahinter stecken; f"ur den Fall, da"s man trotzdem 
auf den Stoppwort-Datensatz zugreift, mu"s die Anzeigeparametrierung
auch noch leicht erweitert werden, damit der Datenbankbenutzer dann 
noch einmal einen Hinweis bekommt, da"s er nach Stoppw"ortern sucht, 
vielleicht sogar mit einer ausf"uhrlicheren Erkl"arung, was ein Stopp-
wort ist.

> 3. ... ich moechte in einem
> "Bandauffuehrungsregister", in das man mit einem FLIP aus der
> Anzeige mehrbaendiger Werke (auch Zss und Serien) gelangt, die
> ersten 15 Zeichen jedes Indexeintrags "verstecken",....

Ich passe.

###

Die besten Gr"u"se aus
M"unchen nach Hamburg:

Heinrich Allers

allers at goethe.de



----- End Included Message -----




Mehr Informationen über die Mailingliste Allegro