Wie kräuseln oder eine Web-Seite wget?

stimmen
16

Ich möchte einen nächtlichen Cron-Job machen, die meine Seite abruft und Stackoverflow diffs es von der Seite des Vortages, so kann ich eine Änderung Zusammenfassung meiner Fragen, Antworten, Ranking etc. sehen

Leider konnte ich das Recht nicht gesetzt von Cookies, etc., diese Arbeit zu machen. Irgendwelche Ideen?

Auch wenn die Beta beendet ist, wird meine Statusseite zugänglich sein, ohne dass beim Einloggen?

Veröffentlicht am 05/08/2008 um 21:38
quelle vom benutzer
In anderen Sprachen...                            


5 antworten

stimmen
9

Ihre Statusseite ist ab sofort ohne Anmeldung (klicken Sie auf Logout und versuchen Sie es). Wenn der Beta-Cookie deaktiviert ist, wird es nichts zwischen Ihnen und Ihrer Statusseite sein.

Für wget:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html
Beantwortet am 05/08/2008 um 21:43
quelle vom benutzer

stimmen
6

Von Mark Harrison

Und hier ist, was funktioniert ...

curl es --cookie Soba =. https://stackoverflow.com/users

Und für wget:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html
Beantwortet am 05/08/2008 um 23:04
quelle vom benutzer

stimmen
3

Gute Idee :)

Ich nehme an, Sie gebrauchte wget die haben

--load-cookies (filename)

könnte ein wenig helfen, aber es könnte einfacher sein, so etwas wie Mechanize (in Perl oder Python) zu nutzen, einen Browser zu imitieren vollständig eine gute Spinne zu bekommen.

Beantwortet am 05/08/2008 um 21:43
quelle vom benutzer

stimmen
2

Und hier ist, was funktioniert ...

curl -s --cookie soba=. http://stackoverflow.com/users
Beantwortet am 05/08/2008 um 22:22
quelle vom benutzer

stimmen
2

Ich kann nicht herausfinden, wie die Cookies zu bekommen entweder zu arbeiten, aber ich konnte meine Statusseite in meinem Browser bekommen, während ich abgemeldet wurde, so dass ich nehme an, das wird funktionieren, wenn Stackoverflow Öffentlichkeit geht.

Dies ist eine interessante Idee, aber nicht Sie auch Diffs des zugrunde liegenden HTML-Code abholen? Haben Sie eine Strategie mit einem diff der html und nicht der eigentliche Inhalt enden zu vermeiden?

Beantwortet am 05/08/2008 um 21:46
quelle vom benutzer

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more