AW: Index-Sortierung mit Umlauten

Thomas Fischer fischer at mail.sub.uni-goettingen.de
Die Sep 14 11:12:28 CEST 2004


Hallo Herr Eversberg,

danke für die ausführliche Auskunft.

> > Meine Frage war, warum beim weiterblättern dies seltsame "24" 
> auftritt und dann
> > nicht beim Anfang des Registers, sondern bei den 
> Kleinbuchstaben weitergeblättert
> > wird.
> Das weiß ich auch nicht. Nur genauere Untersuchung der konkreten 
> Datenbank könnte das erhellen.
Passiert das bei anderen Datenbanken nicht?
Ich habe jetzt auf einer zweiten Installation der selben Datenbank das Verhalten auch nicht nachvollziehen können.

> > 
> > Ich kenne mich mit C zwar nicht so recht aus, kann mir aber 
> nicht vorstellen, dass
> > es keine andere Sortierung als die nach ASCII-Wert zu 
> produzieren in der Lage ist.
> > Und C steckt doch in Allegro-C drin, oder?
> Die Sortierung allein ist nicht das Problem, es gibt noch zwei andere:
> Das eine Problem ist, daß dann einzelne Zeichen entweder 
> denselben Sortierwert 
> hätten wie andere Zeichen (ä = a) ODER einen Wert wie eine 
> Kombination aus zwei 
> anderen Zeichen (ä = ae). Beides geht mit dieser Indextechnik 
> nicht. Nur eine 
> Sortierung a<ä<b wäre lösbar, dies haben wir mit dem i-Befehl in den 
> Indexparametern ja auch ermöglicht (Handbuch 10.2.4.6).

Interessant, das habe ich mir noch nie daraufhin angesehen.
Bei mir steht im A99-Handbuch
10.2.4.6  Unicode-Ersetzungsbefehle für UTF-8-Codes 
und von einem i-Befehl ist nicht die Rede.
Sie meinen wohl den i-Befehl in 
10.2.4.5  Indexcodes
nehme ich an.

Hat jemand in der Liste vielleicht schon einmal eine Sortierung für den Windows-Zeichensatz oder Latin-1 aufgeschrieben, die sie oder er an mich weitergeben könnte? Das wäre mir jedenfalls lieber als die Umlaute am Ende zu haben.

(Nebenbei:
Um auf dem neuesten Stand zu sein habe ich dazu Version 24.5 installiert. inst-all.exe meldet sich nach Doppelklick zwar korrekt mit allegro-C-V24.5, das große Windows-Installer-Fenster (bzw. der Hintergrund?) meldet aber allegro-c V24.42 (02-06-2004). Das hat mit kurzzeitig irritiert.
)

> Das ist es aber nicht, 
> was Sie wollen. Gleichordnung von ä und a oder ä und ae führt zu 
> diesem Problem: 
> Was soll passieren, wenn es "Müller, Jörg", "Mueller, Jörg", 
> "Müller, Joerg" und 
> "Mueller, Joerg" alle zugleich in einer Datenbank gibt? Wie soll 
> das im Index aussehen?

Das von mir bevorzugte Betriebssystem stellt dafür seit etwa 20 Jahren interne Routinen bereit, die unterscheiden zwischen
- primärer und sekundärer Ordnung (a und ä habe gleiche Primär-, aber verschieden Sekundärordnung)
- Buchstaben, die den gleichen Wert wie eine Kombination aus zwei oder mehr Buchstaben haben,
- Buchstabenkombinationen, die den gleichen Wert wie ein Buchstabe haben.
Diese Routinen werden in ihrer Anwendung durch die Spracheinstellung des Systems gesteuert.
In Deutschland gibt es da natürlich noch den Unterschied zwischen Wörterbüchern und Telefonbüchern. Sollte also ein Namensindex anders sortiert werden als ein Schlagwortindex???

> ...
> > Das Problem ist in sofern etwas ernsthafter, als beim Blättern 
> > im Index heutzutage eine korrekte Sortierung von Sonderzeichen
> > erwartet werden kann - die bibliothekarische Software ist da
> > wohl noch etwas hinter der Zeit zurück.
> Nur unsere.

Nein, nicht nur. Ich hatte mir die Register unseres Pica-Systems angesehen, da sieht das so aus:
	  	2 	ueberabzaehlbar
	  	1 	ueberabzaehlbarer
	  	1 	ueberadditive
	  	1 	ueberadditiven
	  	1 	ueberadiabatischen
	  	1 	ueberaengstlicher

Und ich will ja auch gar nicht weg von Allegro, hätte nur noch gerne die eine oder andere kleine Verbesserung...


Mit freundlichen Grüßen
Thomas Fischer