[Allegro] Blaehungen im Index?

Thomas Berger ThB at Gymel.com
Mi Apr 27 10:09:29 CEST 2011


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Lieber Herr Eversberg,

> Die Blockgröße ist z.B. 2048, Freiraum 128, also 6.25%. Das

lies: "mindestens 6,25%", denn es wird stets eine ganzzahlige
Anzahl von Schluesseln in so einem Block abgelegt?

Und so wie sie es schildern, ist es dann plausibel, dass es
beim Ergebnis von index - at 1 (Primaerschluessel = viele kurze
Nummern mit geringer Gemeinsamkeit gefolgt von langen
Schluesselerersetzungen) der Verschnitt 30% betragen kann?

Der Gesamtindex enthaelt neben den Primaerschluesseln aus dem
ersten Indexlauf mit Anteil 25% auch ein Uebernahmeregister,
das nach meiner Faustformel ca. 740 MB gross ist (Mehrwort-
Eintraege gefolgt von Uebernahmeschluesseln: auch keine gute
Reduktion am Schluesselanfang moeglich), damit waeren dann 12%
Verschnitt in der Gesamtdatenbank auch plausibel.

Aber welche Erklaerung koennte es fuer die starken Unterschiede
im Speicherbedarf zwischen den doch recht aehnlichen Datenbanken
1 und 2 aus meinen Messungen geben?

viele Gruesse
Thomas Berger


-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (Cygwin)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iJwEAQECAAYFAk23zzkACgkQYhMlmJ6W47MtJwQAj6wGewfRu8n7ssKiq2UcWViP
ytJk9Utnzmo5qVRLtqcv3OejhSsPX9W0Dvbk3tuE1JWuLmocY21LMQ3tsM1CtVAB
SnuUZzq2Ybf7xPUPsjICgLgadKZXHXgcUbH0+poc9nT9pqzZiK+o+NVnehBvLavq
fA150a0ThiI14pK6OsM=
=amEt
-----END PGP SIGNATURE-----



Mehr Informationen über die Mailingliste Allegro