Max. Anzahl Datensaetze

Ralf Matalla matalla at cdmail.ub.uni-duesseldorf.de
Di Nov 16 10:37:37 CET 1999


Herr Eversberg,

ich habe da ein kleines Verstaendnisproblem - die Zahlen scheinen 
sich mal auf die Dateien, mal auf die Datenbank zu beziehen.
> 
> So sieht der von uns weiter praezisierte Berger-Vorschlag aus:
> Momentan ist in der TBL der Anfangspunkt (sog. "Offset") eines jeden
> Daten- satzes mit 3 Byte codiert, wobei ein Datensatz mit seiner
Mit 3 Byte lassen sich 16 MB adressieren, die Obergrenze fuer die 
einzelnen Dateien - also gelten diese 3 Byte fuer jede Datei?!

> exakten Laenge abgespeichert wird, ohne ein einziges Byte mehr -
> wenn man keine Fuellzeichen zulaesst. Wenn man nun festlegen wuerde,
> dass die Laenge eines Datensatzes immer ein Vielfaches von N sein
> muss (N = 2, 3, ...), koennte man die N-fache Zahl von Saetzen
> haben. Es muesste lediglich in der TBL statt der tatsaech- lichen
> Position die durch  N geteilte Zahl gespeichert werden. Mit N = 3
> kaeme man also schon auf 24 Millionen Saetze, wobei jeder einzelne
24 Millionnen Saetze in der Datenbank insgesamt (bei 500 Byte pro 
Datensatz)
> Satz hoechstens 2 Byte (Fuellzeichen) mehr haette als er braucht,
> denn die einzelne Datei koennte dann 48 statt 16 MB gross werden.

Und bloss im Schnitt ein Byte pro Datensatz Fuellzeichen - das 
ist gut. 24 Millionen Saetze, etwa 12 GB Daten: das sind eine Menge.

So gesehen ist der Vorschlag gut.

> Zwar kann man mit 4 Byte gut 4 Milliarden Datensaetze nummerieren,
> doch ist das eine illusorische Zahl, weil es nur 255 Dateien (Typ
> .ALD) mit bis zu 16.000.000 Byte geben kann. Hat man z.B. Saetze mit
> durchschnitt- lich 500 Byte, kommt man damit auf  "nur" ca. 8
> Millionen Datensaetze. 
Hier verstehe ich den Zusammenhang mit obigem nicht! Wenn anstelle 
der 3 Byte fuer die Codierung des Anfangspunktes 4 Byte verwendet 
werden - kann doch jede Datei 4 Milliarden Byte adressieren (4 GB).
Dann muss einmal neu indexiert werden. Die Position 1 der TBL gibt 
dann 3 oder 4 Byte an - die Programme koennten das flexibel 
handhaben. Und niemand muss in der api etwas einstellen.

Wie umfangreich diese Programmaenderungen sind, das weiss ich 
natuerlich nicht.

Was mache ich fuer einen Denkfehler?

Schoene Gruesse

Ralf Matalla

Universitaets- und Landesbibliothek Duesseldorf
IVS- und CD-ROM-Koordination
Fachref. Mathematik u. Datenverarbeitung
Universitaetsstr. 1
40225 Duesseldorf
Tel.: ++49 211 81-13527
Fax:  ++49 211 81-13054





Mehr Informationen über die Mailingliste Allegro