[Allegro] PHPAC-Doku aktualisiert

Thomas Berger ThB at Gymel.com
Di Nov 9 11:57:44 CET 2010


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg,

>> Und wenn man die Sprachinformation haette, wuerde man sie
>> im Zweifelsfall auch nicht nutzen, sondern die Sprachinformation
>> des Benutzerbrowsers aus werten (in der Hoffnung, dass sie
>> seine Praeferenzen spiegelt): Ist der Browser auf deutsch
>> eingestellt, wird auf "oe" kollationiert, sonst auf "o" (Das
>> geht natuerlich mit allegro nicht).
> Und womit geht's? Auf was könnten wir umsteigen?

Das Problem ist ja die Kollationierung "on the fly": Die Anzahl
der verschiedenen Worte in einem Register ist natuerlich auch
bei grossen Datenbanken eher klein, wenn da aber viele
Eigennamen drin sind, erheblich genug, dass man nicht unbedingt
bei jeder Suchanfrage das ganze Register neu durchsortieren
moechte...

Was aber m.E. durchaus (mittels Sekundaerindexierung oder n-Grammen?)
stattfindet, dass Datenbanken Tabellen oder Indizes mit nicht umcodierten
Stichworten enthalten, die dann rasend schnell volltextdurchsucht
werden (somit geht dann auch Binnen- und Linkstrunkierung), wobei
dann bereits eine (Standard-?) Kollationierung greift, die "oe"
findet, wenn "ö" gesucht wird, evtl. auch umgekehrt [Ich koennte mir
hier vorstellen, dass eine Standardkollationierung benutzt wird, die
stark normiert, etwa auch Klein- und Grossbuchstaben gleichsetzt].

Wenn das Ergebnis dann nur einige 10.000 Worte enthaelt, kann man
es auch noch schnell im Arbeitsspeicher nach dem spezifischeren
Begriff durchfiltern und entsprechend einer ganz anderen Kollationierung
umsortieren, das ist dann eher kein Problem mehr (wenn der Prozess
fuer einige Millisekunden 20 oder 50MB zusaetzlich alloziert, ist
das beherrschbar: Man kann ausrechnen, wie viele Maschinen man
fuer wieviele simultane Nutzeranfragen benoetigt und entsprechend
einkaufen).

viele Gruesse
Thomas Berger
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (Cygwin)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iJwEAQECAAYFAkzZKSgACgkQYhMlmJ6W47NeFQQAr2NkChh+rayKpRcb4qGXdKUt
/yKmNEJQBy+LMAA0ARLqA9CgwzoCSp2NMVs1yuKiUikHw1EalfbC+1WSyT/QuogP
13gdg43g/9etYVk9DTrSfELxB88zOdpmaYcW4cjF+84ybjM7hhaPAv6Q/auP0hnB
fqqSNtMj5ZR/TymGS18=
=HIC2
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro