[Allegro] Indexparameter cat.api modernisieren?

Anando Eger a.eger at aneg-dv.de
Fr Jul 23 13:35:01 CEST 2010


Lieber Herr Berger, Liebe Listenleserinnen und -leser,

> Wenn man doch irgendwo Phrasen(!) in ¬...¬ eliminieren moechte
> ("Vorg. u. Forts. u.d.T.:" ), darf man nicht zu frueh am "Trennzeichen"
> zerlegen.

Wenn von allen entstehenden Worten nur die mit Länge > 2
erlaubt werden, bleibt vom obigen Beispiel nur noch "vorg" und "forts".
(Trennzeichen SPC und DOT vorausgesetzt)

Wer danach sucht ist selbst Schuld und: wer sehr unscharf sucht
wird sehr viel finden ... das läßt sich auch mit bestem Willen nur mit
überproportional großem Aufwand verhindern.

Schlußfolgerung: Das Verfahren wird in jedem nichtrivialen Fall abhängig
vom Inhalt der Datenbank. 

Daher fände ich es günstig, wenn die zugeh. ak-Zeilen + Behandlung in einem
"standard"-include ausgelagert werden könnten. (+ dazu Festlegung 
reservierter Sprungmarken).

Wer will, kann dann daran ohne Änderung der "Standard"-Indexparameter 
"herumschrauben".

Ähnlich wird das ja schon bei der Signaturbehandlung gehandhabt.

Viele Grüße
Anando Eger

---------------------------------------------------------------------
Anando Eger Datenverarbeitung
Herr Dipl.-Ing. Anando Eger
Gustav-Voigt-Str. 24
01156 Dresden
Tel.: +49 (0)351 454 1236  http://www.aneg-dv.de
Fax: +49 (0)351 454 1238  mailto:a.eger at aneg-dv.de
---------------------------------------------------------------------





On 23 Jul 2010 at 12:26, Thomas Berger wrote:

> -----BEGIN PGP SIGNED MESSAGE-----
> Hash: SHA1
> 
> 
> 
> Am 23.07.2010 12:07, schrieb Anando Eger:
> > Liebe Listenleserinnen und -leser,
> > 
> > warum nicht z.B. so:
> > 
> > ak=2.."[trennzeichen]"+Marke
> > ak=4.."[trennzeichen]"+Marke
> > 
> > ...
> > 
> > #-Marke
> >   // hier:
> >   // - Unterfelder wegwerfen oder getrennt behandeln
> >   // - unerwünschte/zu kurze Worte filtern
> >   // - spezielle Zeichenumcodierungen
> > ...
> >   // Ergebnis in z.B. #uKR 
> > #uKR dKR p{ "~e1" }
> 
> #uKR dKR y0 p{ "~e1" }
> 
> > #+#
> > 
> > Ist einfach & robust und ergibt keine Überläufe.
> 
> Wenn man doch irgendwo Phrasen(!) in ¬...¬ eliminieren moechte
> ("Vorg. u. Forts. u.d.T.:" ), darf man nicht zu frueh am "Trennzeichen"
> zerlegen.
> 
> Der Einwand betrifft natuerlich auch die Vorgehensweise bei der
> "traditionellen" Indexierung von #20ff seit Anno Tuk, es scheint
> also eher niemanden zu stoeren.
> 
> viele Gruesse
> Thomas Berger
> -----BEGIN PGP SIGNATURE-----
> Version: GnuPG v1.4.9 (Cygwin)
> Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/
> 
> iJwEAQECAAYFAkxJbnEACgkQYhMlmJ6W47OHawQAvpBXBjvsiPsj/a+cn6u4G8Ar
> OY5/ud/EIgSVGslX1wNsuQqgGA1rEvzoIV2Yc1SCZa0LRqad+pDUE8l/i/BkGEmi
> H6oLI5rNeM75vufOYHStHA81zRY7dVKVyIAtACpAGWcqVwkiy+tAT20BS3m5xMwv
> FU1oUZhYzL+RcQaeShM=
> =7fjW
> -----END PGP SIGNATURE-----
> 





Mehr Informationen über die Mailingliste Allegro