[Allegro] frage zur dnb.flx

Thomas Berger ThB at Gymel.com
Mo Mär 17 12:21:59 CET 2014


Lieber Herr Eversberg,

>> Beim herauskratzen aus der Website. Die Links auf die Schlagworte haben nun
>> (wg. Barrierefreiheit) ein Title-Attribut, und der Flex sucht nach '">'
>> um sich irgendwie am Ende des A-Tags fuers erste Schlagwort zu positionieren,
>> es gibt keinen zwingenden Grund, warum das funktionieren sollte und es
>> funktioniert auch offensichtlich nicht.
>>
> Auch hier überläßt er es wieder uns, die entspr. Änderung zu machen,
> die ich gerade vorhin, dies schon vorausahnend, angekündigt habe.
> Vielleicht arbeitet er nebenbei an einer viel besseren Lösung, die
> zwingend funktionieren wird... (ohne aus dem Auge zu verlieren, daß sie
> für alle Daten funktionieren sollte, nicht nur für die schon 12 Monate
> abgelagerten, sowie ohne daß man jeweils zwischen a99 und Browser wechseln muß.)

Meine Onlinebanking-Software hat scheinbar eingebaute Hamster, jedenfalls
versieht sie mich automatisch mit Updates, wenn irgendwo die Banken ihre
HTML-Formatierungen etc. geaendert haben, damit das Screenscraping wieder
funktioniert (auch in dem Sektor gibt es irgendwelche Standards, aber
nicht alle bieten die Kommunikation darueber an - ist also durchaus
vergleichbar mit dem Angebot der DNB).

Es gibt bei der DNB den "Datenshop" mit registrierungs- (und fuer neueste
Titel auch kostenpflichtiger) Uebernahmemoeglichkeit, aber das ist hier
ja oft genug durchdiskutiert worden, die betriebswirtschaftlichen Zwaenge
sind nun einmal so, dass man die (maximal) 10 Cent pro hochwertiger
Titelaufnahme niemals aufbringen kann und lieber per dnb.flx die auf
Dublin-Core-Niveau eingedampften Aufnahmen uebernimmt und dann in
Handarbeit auf den eigenen Standard anhebt (Bibliothekspersonal ist
also entweder unendlich fix oder unendlich preiswert).

Dem dnb.flx ist allerdings vorzuwerfen, dass er zu starke Annahmen ueber
die konkrete Quellform der HTML-Anzeige macht, d.h. die Funktionalitaet
zerbricht in mehr Faellen von Aenderungen als noetig waere. Wie folgt
ist es robuster:

spaces
...
var (b"rter</strong>" b"</td>" b"<td" e"</td>" b"[>]" u<> f" " F" ")
ins _<_<_
ins _>_>_
ins #31

(bitte nicht #31s)

[Eigentlich sollte es sich mit den x/X-cstrings noch etwas robuster gestalten
lassen, mit (Quelltext der DNB-Anzeige in der Zwischenablage)

x cpaste\spaces\var (b"rter</strong>" b"</td>" x"td")\mess

bekomme ich aber nur leere Ergebnisse]



>> (der sich wundert, warum die ganzen 'b">"' ueberhaupt funktionieren: Sollte
>> das in Flex nicht so wie in der Exportsprache sein?)
>>
> Lektüre der Beschreibung in  xcstring.rtf  würde ihm diese Frage beantworten.

Dort lese ich:

Ausnahmen: Statt (b"<") muß man (b"[<]") schreiben, entspr. für die Zeichen  >,
# und ~

also darf ich mich doch wundern, dass es auch ohne funktioniert?

viele Gruesse
Thomas Berger



Mehr Informationen über die Mailingliste Allegro