Sonder-Vb.2: STAR links ueberholt

Thomas Berger ThB at gymel.com
Sa Mär 24 10:44:55 CET 2001


Lieber Herr Eversberg,
 
> An der DemoBank getestet:
> Indexdatei vergroessert sich um ca.      70%
> Erstellungszeit verlaengert sich um ca.  30%

Was aber stark von der Position der Sprungmarke abhaengt...

...

> Der Satz mit der groessten Schluesselzahl (Heisenbergs Werke
> als hierarchischer Satz) kriegt allerdings 622 statt 117
> Eintraege! Da ist wohl doch noch eine Aufbohrung faellig,
> denn das Maximum ist bisher 500.

Oh, bitte sehr: Mit dieser Grenze hatte ich schon 1992 gewaltigen 
Aerger. Gibt es dann nicht auch ein Problem mit der anderen
hart-codierten Grenze, dass naemlich die Gesamtlaenge aller
Schluessel des Satzes maximal 10.000 Zeichen sein darf?


> Wenn die Sache Anklang findet, werden wir's angehen.

Ich will Sie ja nicht entmutigen, aber ich habe vor vielen
Jahren einmal den Soundex-Algorithmus fuer die phonetische 
Suche parametriert und niemand hat sich je dafuer interessiert,
geschweige denn genutzt...

...


> Hier der bisherige Abschnitt in CAT.API:
...
>    Und hier die neuen Zeilen, die die neuen Eintraege machen:
>    Jetzt zerlegen:
> #-OE
> #utw y0 p{ 8 "|2" }
> #utw +OE y0 b1 =tw
> #+#

etwas besser (auf Geschwindigkeit kommt es hier ja an):

#-OE
!utw p{ 8 "|2" }
!utw +OE dtw b1 atw
#+#

Die Umcodierung hat ja schon stattgefunden...
Kleines Problem: M"uller erzeugt
mueller
ueller
eller
ller
...

Also zwei Varianten fuer einen Umlaut. Vermutlich ist es
aber besser, bei der ersten Zuweisung an #utw auf das "y2"
zu verzichten.

Die meisten Systeme schreiben uebrigens vor, dass mindestens
zwei oder drei Zeichen angegeben werden, bevor die Trunkierung
erlaubt ist. Das regelt sich hier vermutlich von selbst, wenn
viele kurze Schluessel entstehen. Parametrieren lohnt vermutlich
nicht, weil der l-Manipulationsbefehl nur die Laenge in eine
Anwendervariable schreibt, also ein zusaetzlicher Test erforderlich
ist.

viele Gruesse
Thomas Berger




Mehr Informationen über die Mailingliste Allegro