[Allegro] Zur Zukunft von a30 - PS

Michael Lackhoff michael at lackhoff.de
Do Aug 30 17:23:42 CEST 2012


On 30.08.2012 16:22 Bernhard Eversberg wrote:

> Schräge Metapher, denn sie können nicht aus sich heraus reden.

In der Tat. Und was sie reden laesst sich ja bei beiden sehr weitgehend
konfigurieren (s.u).

> Im Unterschied zu einem Einwurfschlitz-System zeigen sie
> aber, sofern einem in die Register zu blicken die Zeit
> nicht zu schade ist, nicht nur, was da ist, sondern auch
> was nicht da ist und was falsch drin ist. Dafür bringt
> VuFind immer irgendwas raus, und das wird so gewollt, denn
> das Null-Treffer-Problem stiftet Verwirrung und ist zu
> vermeiden oder zu umgehen. Das macht VuFind auch nicht
> total schlecht, und wir haben aus der Anerkenntnis heutiger

Da kann Allegro durchaus in Anspruch nehmen, seiner Zeit weit voraus
gewesen zu sein. Solr (und damit Vufind) macht ja nichts anderes als
das, was Allegro auch schon mit seinem Index vormacht: Die Daten
tokenisieren (ak-Befehle) und dann normalisieren (Korpus der
Index-Parameterdatei). Damit versuchen beide, der
Null-Treffer-Problematik zu begegnen.
Nur dass Solr mittlerweile natuerlich viel mehr Moeglichkeiten der
Normalisierung bietet als Allegro. So alte Bekannte wie Umsetzung auf
Kleinschrift, Entfernung von Stop-Woertern, Aufloesung von Umlauten sind
aber durchaus vergleichbar. Hinzugekommen sind z.B. Stemming und
Synonym-Ersetzungen.
Beide loesen das Problem unterschiedlicher Suchanforderungen durch
Redundanz im Index, also einfach mehrere bereitgestellt werden.
Und damit sind wir beim Einwurf von Herrn Lehmann: Je weniger man in
einem Index/einem Suchfeld normalisiert, um so weniger "luegt" das
System (d.h. um so mehr steigt die precision und um so mehr sinkt der
recall[1]). Wobei man in Solr die Moeglichkeit hat, gleichzeitig mit
unterschiedlicher Gewichtung in mehreren Indexen zu suchen und damit das
Dilemma entschaerft, sich fuer eins von beidem (precision oder recall)
entscheiden zu muessen.

> Aber eben die Wollmilchsau, mit der die klassischen Katalog-
> funktionen zu einer Nebensächlichkeit herabsinken zugunsten
> überlegener Funktionalitäten des Knowledge Engineering, wie das
> nicht nur Bergern vorschwebt, das ist allegro nun mal nicht und schon
> gar nicht seine Web-Schnittstellen. Die Welt wird nicht nachlassen, bis
> dieses Wunderwesen erfunden ist, machen wir uns da nichts vor. Bis
> dahin halten wir's mal noch am Schnaufen, unser altes Arbeitspferd.

Natuerlich gibt es keine Wunderwesen aber sehr wohl bemerkenswerten
Fortschritt. Allegro war da mal ganz weit vorn. Das ist es heute sicher
nicht mehr, kann aber noch ganz gut mithalten, wenn es denn gut in eine
moderne Umgebung integriert wird. Und das (womit wir wieder beim
urspruenglichen Thema waeren) laesst sich halt nach dem Stand der
Technik am besten mit einer MVC-Architektur[2] erreichen. Und auf etwas
in der Art scheinen mir die Hinweise der meisten Kollegen
hinauszulaufen, also insbesondere den View zu verselbstaendigen, um sich
einerseits moeglichst wenig darum kuemmern zu muessen (kann man den
Designern ueberlassen) und andererseits flexibel auf neue Anforderungen
(mobile devices oder was auch immer) eingehen zu koennen.

Viele Gruesse
Michael Lackhoff

[1] http://en.wikipedia.org/wiki/Precision_and_recall
[2] http://en.wikipedia.org/wiki/Model%E2%80%93view%E2%80%93controller



Mehr Informationen über die Mailingliste Allegro