Schrift
Wiki:Tipp zum Debugging: use Data::Dumper; local $Data::Dumper::Useqq = 1; print Dumper \@var;
[thread]335[/thread]

Seite im Browser mit Strip/Parse scannen: ohne die genaue url zu wissen

Leser: 1


<< >> 7 Einträge, 1 Seite
justme69
 2004-07-23 00:23
#3225 #3225
User since
2004-07-19
31 Artikel
BenutzerIn
[Homepage] [default_avatar]
Hallo...

Mein script zum automatischen browsen funzt einigermaßen.
habe jetzt festgestellt, daß etliche, gewollte Zielseiten allergings eine Weiterleitung beinhalten, deren ziel-url ich nicht kenne.
Z.B. weil der link erst aus ner DB kommt.

Gibt es eine Möglichkeit perl irgendwie zu sagen - lade diese (bekannte) url - warte 5sec und hole dann die seite, die im browser angezeigt ist - ohne diese 2te url zu kennen ?

Beispiel. Bei google suche ich was, speichere die gefundenen Links in ner Datei und lasse die links nacheinander abarbeiten - und will auf den Ergebnisseiten nach Textpassagen suchen.
Solange auf den Ergebnisseiten nicht wieder intern via refresh und co - oder javascript umgeleitet wird, geht das suchen nach Textpassagen.

Hmmmm ;)  hab ich mich jetzt verständlich ausgedrückt ???

Die Seiten hole ich bisher mit LW::UserAgent , den text ermittle ich mir mit HTML::Strip - nein, nicht Stripper !

Bin für Ideen, Anregungen, Code-Schnipsel dankbar.  ;)
MfG
Stefan
[E|B]
 2004-07-23 11:53
#3226 #3226
User since
2003-08-08
2561 Artikel
HausmeisterIn
[Homepage] [default_avatar]
Ich versuche es mal einfach auszudrücken:
Du hast Angst, dass du auf Seiten kommst, die ein...

Code: (dl )
<meta http-equiv="refresh" content="0; URL=url.html">


beinhalten und du so nicht auf den Inhalt zugreifen kannst?
Gruß, Erik!

s))91\&\/\^z->sub{}\(\@new\)=>69\&\/\^z->sub{}\(\@new\)=>124\&\/\^z->sub{}\(\@new\)=>);
$_.=qq~66\&\/\^z->sub{}\(\@new\)=>93~;for(@_=split(/\&\/\^z->sub{}\(\@new\)=>/)){print chr;}

It's not a bug, it's a feature! - [CGI-World.de]
justme69
 2004-07-23 12:11
#3227 #3227
User since
2004-07-19
31 Artikel
BenutzerIn
[Homepage] [default_avatar]
Nicht ganz, dann hätte ich ja die URL, auf die umgeleitet wird.  ;)

Ich lasse mir den HTML_Inhalt und den Textinhalt einer solchen seite ausgeben. Habe nach solchen Stellen (URL= - o.ä) gesucht - sehe sie aber nicht.

Das bedeutet für mich, daß diese Umleitung so nicht erkennbar ist...

teilweise rufe ich seiten auf, die einen scriptaufruf beinhalten - ich vermute der link wird dann über das gerufene script ermittelt - und das sehe ich niergends...
MfG
Stefan
pq
 2004-07-23 17:02
#3228 #3228
User since
2003-08-04
12208 Artikel
Admin1
[Homepage]
user image
weiterleitungen werden entweder über html-meta gemacht oder über den Location-header.
bei beiden kannst du die ziel-url herausfinden.
wird per javascript eine weiterleitung gemacht, kannst du die url nicht rausfinden,
(es sei denn, über ein javascript-modul).
Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
lesen: Wiki:Wie frage ich & perlintro Wiki:brian's Leitfaden für jedes Perl-Problem
justme69
 2004-07-23 17:13
#3229 #3229
User since
2004-07-19
31 Artikel
BenutzerIn
[Homepage] [default_avatar]
Hi...

Oder auch seiten, die Teile/Alles ihres outputs über nen script (egal ob javascript, php oder perl) anzeigen lassen - liest LWP::UserAgent eben nur die über die url angegebenen Daten ein - ohne die über script geholten Daten.

Mich interessiert, wie kann ich das, was aktuell im Bowser angezeigt wird, unabhängig davon, was als url angegeben ist, verarbeiten ???

Kann ich das z.B. in eine Datei speichern und weiterverarbeiten ?
weitere Ideen, Alternativen ???
MfG
Stefan
pq
 2004-07-23 17:47
#3230 #3230
User since
2003-08-04
12208 Artikel
Admin1
[Homepage]
user image
[quote=justme69,23.07.2004, 15:13]
Oder auch seiten, die Teile/Alles ihres outputs über nen script (egal ob javascript, php oder perl) anzeigen lassen - liest LWP::UserAgent eben nur die über die url angegebenen Daten ein - ohne die über script geholten Daten.[/quote]
werd mal konkreter - was bedeutet das, eine seite, die einen teil ihres
outputs über ein script anzeigen lässt?
(dabei ist es überhaupt nicht egal, ob javascript, php oder perl: javascript
ist clientseitig, php und perl serverseitig. (i.d.R.))
das sind alles so vage andeutungen. entweder ich habe eine url, die auf eine
statische HTML-seite zeigt, oder eine url, die ein skript (serverseitig)
anspricht, das HTML generiert. im HTML kann nun noch javascript sein, aber kein
perl oder php (mit ausnahmen)
Quote
Mich interessiert, wie kann ich das, was aktuell im Bowser angezeigt wird, unabhängig davon, was als url angegeben ist, verarbeiten ???

ich versteh dich nicht. LWP::UserAgent ist auch nur ein browser. was meinst
du, was dein browser anders macht?
es klingt so, als läuft dein browser, und nebenher dieses perl-skript, und das
skript soll nun den browser fragen, welche seite er gerade anzeigt? das wird
wohl nicht gehn.
aber wie schon gesagt, ausser redirects o.ä. mit javascript kannst du alle
redirects auch mit LWP::UserAgent nachvollziehen.

am besten, du nennst ganz einfach mal eine konkrete url. was du so erzählst,
lässt ja vermuten, dass du ein beispiel vor augen hast.
Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
lesen: Wiki:Wie frage ich & perlintro Wiki:brian's Leitfaden für jedes Perl-Problem
justme69
 2004-07-23 21:37
#3231 #3231
User since
2004-07-19
31 Artikel
BenutzerIn
[Homepage] [default_avatar]
[quote=pq,23.07.2004, 15:47]... oder eine url, die ein skript (serverseitig)
anspricht, das HTML generiert. im HTML kann nun noch javascript sein, aber kein
perl oder php (mit ausnahmen)

am besten, du nennst ganz einfach mal eine konkrete url. was du so erzählst,
lässt ja vermuten, dass du ein beispiel vor augen hast. [/quote][/quote]
Okokok... ;)

Ein Beispiel:  http://www.mayapaid4mail.com/scripts/runner.php?EA=200407211212087051
in einer Zeile geschrieben. Allerdings dürftet ihr da nur auf ein Login-Bild kommen.

Also steckt php dahinter.  ;)

Kennt ihr euch mit den Paid4-Themen aus ?
Im Endeffekt will ich (im Moment) nix anderes als ein programm, das mir die paid-mails bestätigt und mich bei erforderlicher Eingabe (Login,etc) benachrichtigt - z.B. mit Sound oder längerer Verweildauer etc.
Ich hab nicht gleich damit so rausgerückt, weil das die Paid4-Anbieter nicht gerade gerne sehen  ;)
MfG
Stefan
<< >> 7 Einträge, 1 Seite



View all threads created 2004-07-23 00:23.