[Allegro] Windows-Fehler bei Indexierung mit kleiner, aber spezieller cat.api

Thomas Berger ThB at Gymel.com
Mo Feb 8 11:39:03 CET 2010


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg,

>> Bis wohin kann ich denn eine Anwendervariable akkumulieren: Wirklich
>> bis zur Grenze der Hintergrundspeicherkapazitaet (oder meintewegen
>> der Haelfte davon abzueglich dem bereits fuer andere Variablen
>> verbrauchten?)
>>
> Ja, die Hälfte ist ein Richtwert, aber dann darf es in dem Moment keine
> anderen Variablen geben.

D.h. Hintergrundspeicher ist das einzige Limit fuer das Handling
von Anwendervariablen. Muss ich bei Gelegenheit einmal verifizieren.


> Außerdem weiß ich nicht, ob Sie genau gelesen haben. Ich hatte
> hervorgehoben:
>> *innerhalb des Abschnitts einer einzelnen ak-Bearbeitung*.
> 
> Jetzt mal kristallklar: Wenn man hätte
> ak=20" "+K
> und #20 hätte 2 Wörter, dann ergibt das ZWEI Bearbeitungen, d.h. der
> Abschnitt #-K wird *2mal* abgewickelt, und in JEDEM dieser beiden
> Fälle dürfen maximal umfangsmäßig 19800 Byte mit *beliebig* vielen
> Codes 8 dazwischen rauskommen.

Schon klar. In der Realitaet hat man oft Inhalte ueber verschiedene
Kategorien verstreut, die man zunaechst nicht einfach zerhacken kann
(Laengere Wendungspassagen in Nichtsortierzeichen, teilweise zu
beruecksichtigende Unterfelder etc.). Der Rest nach der Aufbereitung
soll dann aber zerhackt und (u.U. mehrfach: Bindestrichworte,
Varianten fuer Zeichen mit Umlaut) verstichwortet werden.

Dafuer gibt es dann zwei Wege:

1. Ueber die ak-Statements die Aufbereitung vornehmen, alle Inhalte
dabei in /einer/ Anwendervariable einsammeln, abschliessend ein
ak-Statement mit dieser Anwendervariablen bilden, das dann die
Verstichwortung ausloest.

Nachteil: Es entsteht temporaer eine sehr lange Anwendervariable, denn
es gibt die Faelle, wo einige hundert Kategorien des Ausgangssatzes
eingesammelt werden muessen.


2. Ueber die ak-Statements die Aufbereitung vornehmen, die Verstichwortung
dann ueber eine Schleife ueber den Arbeitstext durchfuehren, also mit
expliziten Codes 8

Nachteil: Es kommen viele (aber nicht: "sehr" viele) Schluessel auf einen Rutsch
zusammen.


Nach bitteren Erfahrungen in den 90er Jahren (automatische Permutation:
alle Geo-Schlagworte mit allen Sachschlagworten und dem Formschlagwort
kreuzen, kaum ist man zur Tuere heraus, traegt ein Anwender 6 Geos
und 12 Sachen und 3 Formschlagworte ein...) bemuehe ich mich allerdings
um lineare Relationen zum Ausgangsdatensatz ;-)

viele Gruesse
Thomas Berger
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (Cygwin)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iJwEAQECAAYFAktv6ccACgkQYhMlmJ6W47P1yQP/f+BW5jjhYquAdual09cAeG0d
XDvKpuYn/0umm891Mcijs4k3T6+YjgSRco3IVvcHk2ZVBE+nMbGp4zxyyTZxZo1o
YXbBYQ4UIflSv3Bv6yyhKD/B3WhcozG591OxFRNWw7RSOQuB0pEDzCcBslEmtuf/
Ir6IrAPsVzK3Cxb1GLw=
=cCjg
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro