[Allegro] Indexparameter cat.api modernisieren?
Anando Eger
a.eger at aneg-dv.de
Fr Jul 23 13:35:01 CEST 2010
Lieber Herr Berger, Liebe Listenleserinnen und -leser,
> Wenn man doch irgendwo Phrasen(!) in ¬...¬ eliminieren moechte
> ("Vorg. u. Forts. u.d.T.:" ), darf man nicht zu frueh am "Trennzeichen"
> zerlegen.
Wenn von allen entstehenden Worten nur die mit Länge > 2
erlaubt werden, bleibt vom obigen Beispiel nur noch "vorg" und "forts".
(Trennzeichen SPC und DOT vorausgesetzt)
Wer danach sucht ist selbst Schuld und: wer sehr unscharf sucht
wird sehr viel finden ... das läßt sich auch mit bestem Willen nur mit
überproportional großem Aufwand verhindern.
Schlußfolgerung: Das Verfahren wird in jedem nichtrivialen Fall abhängig
vom Inhalt der Datenbank.
Daher fände ich es günstig, wenn die zugeh. ak-Zeilen + Behandlung in einem
"standard"-include ausgelagert werden könnten. (+ dazu Festlegung
reservierter Sprungmarken).
Wer will, kann dann daran ohne Änderung der "Standard"-Indexparameter
"herumschrauben".
Ähnlich wird das ja schon bei der Signaturbehandlung gehandhabt.
Viele Grüße
Anando Eger
---------------------------------------------------------------------
Anando Eger Datenverarbeitung
Herr Dipl.-Ing. Anando Eger
Gustav-Voigt-Str. 24
01156 Dresden
Tel.: +49 (0)351 454 1236 http://www.aneg-dv.de
Fax: +49 (0)351 454 1238 mailto:a.eger at aneg-dv.de
---------------------------------------------------------------------
On 23 Jul 2010 at 12:26, Thomas Berger wrote:
> -----BEGIN PGP SIGNED MESSAGE-----
> Hash: SHA1
>
>
>
> Am 23.07.2010 12:07, schrieb Anando Eger:
> > Liebe Listenleserinnen und -leser,
> >
> > warum nicht z.B. so:
> >
> > ak=2.."[trennzeichen]"+Marke
> > ak=4.."[trennzeichen]"+Marke
> >
> > ...
> >
> > #-Marke
> > // hier:
> > // - Unterfelder wegwerfen oder getrennt behandeln
> > // - unerwünschte/zu kurze Worte filtern
> > // - spezielle Zeichenumcodierungen
> > ...
> > // Ergebnis in z.B. #uKR
> > #uKR dKR p{ "~e1" }
>
> #uKR dKR y0 p{ "~e1" }
>
> > #+#
> >
> > Ist einfach & robust und ergibt keine Überläufe.
>
> Wenn man doch irgendwo Phrasen(!) in ¬...¬ eliminieren moechte
> ("Vorg. u. Forts. u.d.T.:" ), darf man nicht zu frueh am "Trennzeichen"
> zerlegen.
>
> Der Einwand betrifft natuerlich auch die Vorgehensweise bei der
> "traditionellen" Indexierung von #20ff seit Anno Tuk, es scheint
> also eher niemanden zu stoeren.
>
> viele Gruesse
> Thomas Berger
> -----BEGIN PGP SIGNATURE-----
> Version: GnuPG v1.4.9 (Cygwin)
> Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/
>
> iJwEAQECAAYFAkxJbnEACgkQYhMlmJ6W47OHawQAvpBXBjvsiPsj/a+cn6u4G8Ar
> OY5/ud/EIgSVGslX1wNsuQqgGA1rEvzoIV2Yc1SCZa0LRqad+pDUE8l/i/BkGEmi
> H6oLI5rNeM75vufOYHStHA81zRY7dVKVyIAtACpAGWcqVwkiy+tAT20BS3m5xMwv
> FU1oUZhYzL+RcQaeShM=
> =7fjW
> -----END PGP SIGNATURE-----
>
Mehr Informationen über die Mailingliste Allegro