Re: [Allegro] alternative möglichkeit: DNB-daten im browser zum download

Klaus Lehmann lehmann_klaus at t-online.de
Fr Jun 8 17:27:46 CEST 2012


 
Guten Tag [Frau/Herr] Burghard Grossmann,
danke für Ihre Nachricht.
Am Freitag, 8. Juni 2012 um 16:46 schrieben Sie mir.
Ihre Nachricht finden Sie am Ende dieser eMail.

> Hallo an alle,

> wenn ich einen Textextrakt aus einer HTML-Seite weiterverabeiten möchte,
> benutze ich meistens einen textbasierten Browser, vorzugsweise den aus
> UNIX kommenden Luchs:
> http://de.wikipedia.org/wiki/Lynx_(Browser)

> Konkret in diesem Fall:

> lynx -dump -nolist
> "https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch"

> Mit Shell-Scripting o.ä. kombiniert, erhält man passable Ergebnisse.

> Sicherlich gibt es noch andere Wege, viele Wege führen nach Berlin. :)

> Viele Grüße
> --
> Burghard Großmann


> -------- Ursprüngliche Nachricht --------
> Von: Thomas Berger <ThB at Gymel.com>
> Reply-to: Allegro-C Diskussionsliste <allegro at biblio.tu-bs.de>
> An: Allegro-C Diskussionsliste <allegro at biblio.tu-bs.de>
> Betreff: Re: [Allegro] alternative möglichkeit: DNB-daten im browser zum
> download
> Datum: Fri, 08 Jun 2012 16:10:20 +0200
> Mailer: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:12.0) Gecko/20120428
> Thunderbird/12.0.1

> Hallo Herr Lehmann,

> koennte es nicht statt an Dunklen Geheimnissen eher daran liegen, dass zuerst
> das Betriebssystem am Zug ist und eine eigene Meinung bezueglich Kommandozeilen
> mit "&" hat ?

> viele Gruesse
> Thomas Berger

danke herr grossmann
das ist aber eine weiterführende antwort ;-) . besten dank!
an lynx hatte ich gar nicht gedacht. obwohl ich es für bestimmte 
kommandozeilenaufgaben benutze (z.b. an meinem server anzuklopfen, und 
ihm die ip-nummer des anklopfers zu verraten; das ist ganz nett, was 
man da mit lynx machen kann...). dachte immer, daß wget die erste wahl 
sei. na prima. also lynx.

dann wollen wir mal:
(ist sowieso wochenende, da liste keiner mit ;-)
also füllen wir mal die liste.

naja. es klappt nicht so gut. es klappt gar nicht.  der weg zeigte in 
die richtung berlin. ist in spandau steckengeblieben (das muss jetzt 
keiner verstehen, nur echte "spandauer". wie meiner einer. spandau ist 
älter als berlin. spandau ist nicht berlin. spandau iss janz weit 
wech.)

ok, so siehts aus:
C:\Programme\Lynx>lynx -dump -nolist "http://portal.dnb.de/opac.htm?query=305000
2956&method=simpleSearch"

Looking up portal.dnb.de
Making HTTP connection to portal.dnb.de
Sending HTTP request.
HTTP request sent; waiting for response.
HTTP/1.1 302 Found
Data transfer complete
HTTP/1.1 302 Found
Using https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch
Looking up portal.dnb.de
Making HTTPS connection to portal.dnb.de
SSL callback:self signed certificate in certificate chain, preverify_ok=0, ssl_o
kay=0
Retrying connection without TLS.
Looking up portal.dnb.de
Making HTTPS connection to portal.dnb.de
SSL callback:self signed certificate in certificate chain, preverify_ok=0, ssl_o
kay=0
Alert!: Unable to make secure connection to remote host.

lynx: Can't access startfile http://portal.dnb.de/opac.htm?query=3050002956&meth
od=simpleSearch

C:\Programme\Lynx>

habe die tests mit https und http in der suchzeile durchgeführt.
es gibt m.W. keine wege, die sll-prüfung beim lurch abzuschalten (wget.exe kann 
DAS!). hm. kein weg ins nirgendwo mehr?

gruß k.l.

ps: warum kommt denn bitte schon im browser WAS an, wenn ich diese 
adresse angebe: https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch
????

ps2: evtl geht dieser weg nicht weiter....



> Am 08.06.2012 14:25, schrieb Klaus Lehmann:
>> Guten Tag allerseits, 
>> 
>> ich beschäftige mich seit tagen mit diesem thema:
>> da man erfolgreich an die daten des worldcat rankommt, 
>> warum nicht auch an die DNB?
>> 
>> 
>> https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch
>> wer das in den browser eingibt, bekommt eine komplette TA.
>> hm. was passiert da auf dem browserbildschirm?
>> mit wuery=3050002956 wird nach einer isbn gesucht....
>> 
>> 
>> ich will die nackten daten sehen!
>> also probieren wir es mit wget.exe:
>> 
>> wget.exe ...... https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch
>> da kommt nix. es kommt die seite, die man mit 
>> https://portal.dnb.de/opac.htm sehen würde. 
>> welche magie steckt dahinter?
>> 
>> 
>> ich sach es gleich: ich will nicht auf die berger'schen wege des 
>> datenshops hingewiesen werden. es muss einen anderen weg geben. 
>> diesen! schliesslich bekomme ich mit dem o.g. befehl ja auch was zu 
>> sehen: https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch
>> 
>> 
>> hat jemand eine idee?
>> kennt jemand die genaue befehlsstruktur von opac.htm?query=   UND was 
>> nach dem ersten "&" kommt????
>> 
>> danke und gruß klaus lehmann
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> _______________________________________________
>> Allegro mailing list
>> Allegro at biblio.tu-bs.de
>> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro
> _______________________________________________
> Allegro mailing list
> Allegro at biblio.tu-bs.de
> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro





-- 
Mit freundlichen Grüßen,
Ihr Klaus Lehmann
* http://allegronet.de * eMail: allegronet at t-online.de * phone: 03528-452 807(fax 809) * mobil: 0171-953 7843
* allegronet.de * Klaus Lehmann * D-01454 Radeberg * Kleinwolmsdorfer Str. 37
* Software für zufriedene Bibliothekare: 1000x bewaehrt und ergiebig
* Bereits 4x allegro-utf8. Buchen Sie die allegro-Roadshow
* Yes we can. Only with allegro. Yes we do. Allways with allegro.
* Internetkataloge & WebHosting für Allegro-C & Web 2.0 with VuFind
* 2011: Sponsor der Peter-Sodann-Bibliothek (Staucha)
* 2012: mit allegro-utf8 V3 und allegro-vufind auf der IFLA in Helsinki





Am Freitag, 8. Juni 2012 um 16:46 schrieben Sie:
> Hallo an alle,

> wenn ich einen Textextrakt aus einer HTML-Seite weiterverabeiten möchte,
> benutze ich meistens einen textbasierten Browser, vorzugsweise den aus
> UNIX kommenden Luchs:
> http://de.wikipedia.org/wiki/Lynx_(Browser)

> Konkret in diesem Fall:

> lynx -dump -nolist
> "https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch"

> Mit Shell-Scripting o.ä. kombiniert, erhält man passable Ergebnisse.

> Sicherlich gibt es noch andere Wege, viele Wege führen nach Berlin. :)

> Viele Grüße
> --
> Burghard Großmann


> -------- Ursprüngliche Nachricht --------
> Von: Thomas Berger <ThB at Gymel.com>
> Reply-to: Allegro-C Diskussionsliste <allegro at biblio.tu-bs.de>
> An: Allegro-C Diskussionsliste <allegro at biblio.tu-bs.de>
> Betreff: Re: [Allegro] alternative möglichkeit: DNB-daten im browser zum
> download
> Datum: Fri, 08 Jun 2012 16:10:20 +0200
> Mailer: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:12.0) Gecko/20120428
> Thunderbird/12.0.1

> Hallo Herr Lehmann,

> koennte es nicht statt an Dunklen Geheimnissen eher daran liegen, dass zuerst
> das Betriebssystem am Zug ist und eine eigene Meinung bezueglich Kommandozeilen
> mit "&" hat ?

> viele Gruesse
> Thomas Berger




> Am 08.06.2012 14:25, schrieb Klaus Lehmann:
>> Guten Tag allerseits, 
>> 
>> ich beschäftige mich seit tagen mit diesem thema:
>> da man erfolgreich an die daten des worldcat rankommt, 
>> warum nicht auch an die DNB?
>> 
>> 
>> https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch
>> wer das in den browser eingibt, bekommt eine komplette TA.
>> hm. was passiert da auf dem browserbildschirm?
>> mit wuery=3050002956 wird nach einer isbn gesucht....
>> 
>> 
>> ich will die nackten daten sehen!
>> also probieren wir es mit wget.exe:
>> 
>> wget.exe ...... https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch
>> da kommt nix. es kommt die seite, die man mit 
>> https://portal.dnb.de/opac.htm sehen würde. 
>> welche magie steckt dahinter?
>> 
>> 
>> ich sach es gleich: ich will nicht auf die berger'schen wege des 
>> datenshops hingewiesen werden. es muss einen anderen weg geben. 
>> diesen! schliesslich bekomme ich mit dem o.g. befehl ja auch was zu 
>> sehen: https://portal.dnb.de/opac.htm?query=3050002956&method=simpleSearch
>> 
>> 
>> hat jemand eine idee?
>> kennt jemand die genaue befehlsstruktur von opac.htm?query=   UND was 
>> nach dem ersten "&" kommt????
>> 
>> danke und gruß klaus lehmann
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> _______________________________________________
>> Allegro mailing list
>> Allegro at biblio.tu-bs.de
>> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro
> _______________________________________________
> Allegro mailing list
> Allegro at biblio.tu-bs.de
> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro





Mehr Informationen über die Mailingliste Allegro