Kategorienlaenge

Thomas Berger ThB at gymel.com
Fr Mai 30 09:59:31 CEST 2003


Lieber Herr Deblon,

> > Also: Bis 2.000 Zeichen (1 DOS-Bildschirmseite) kein
> > Problem, darueber hinaus auf eigene Gefahr. Erfahrungsgemaess
> > kann man aber fast alle Volltexte so in "Absaetze"
> > unterteilen, die auf Folgekategorien verteilt werden,
> > dass sich damit leben laesst.
> >
> 
> ... gerade das geht bei uns schlecht, da es sich um Import von
> elektronisch erfassten alten Zeitungstexten fast ohne Absaetze
> handelt, andererseits haeufig Abkuerzungspunkte vorkommen, so
> dass Aufteilung in einzelne "Saetze" auch unschoen waere.

wenn mit der Datenbank nicht "live" gearbeitet wird,
geht auch folgendes: Sie lassen die Volltexte extern
(als .HTML, .PDF, .TXT, whatever) und verlinken aus
allegro darauf. Ausserdem ist es ziemlich einfach,
das Format der ii-Dateien fuer QRIX nachzubilden,
d.h. Sie koennten die Datenbank zuerst regulaer
indexieren, dann aus den Volltexten ii-Dateien
bauen und diese mit qrix zum Index ergaenzen.
Ich habe das mal mit der King James Bibel gemacht,
war weiter kein Problem (nur dass man bei Volltexten
dieses Umfangs dann doch am liebsten Phrasensuche und 
NEAR-Operatoren bei der Recherche haette).

viele Gruesse
Thomas Berger




Mehr Informationen über die Mailingliste Allegro