Schrift
[thread]5742[/thread]

web spider gesucht..: ....



<< >> 5 Einträge, 1 Seite
steinwolf
 2003-09-22 18:57
#54633 #54633
User since
2003-08-04
367 Artikel
BenutzerIn
[default_avatar]
Hi,
ich suche einen einfachen Spider, der eine Website und seine Links nach Inhalten durchsucht..

Im CPAN habe ich nichts dergleichen gefunden. Entwickelt wogar jemand sowas zurzeit??

mfg steinwolf
"Did you know? You can use your old motor oil to fertilize your lawn." - Blinkster - Professionelles EDV Forum
eisbeer
 2003-09-22 19:55
#54634 #54634
User since
2003-08-29
347 Artikel
BenutzerIn
[Homepage] [default_avatar]
Igitt spider, wofür willsten sowas?

Ansonsten: LWP::Simple
Die meisten PC Probleme befinden sich zwischen Bildschirm und Stuhl...
jan
 2003-09-22 20:18
#54635 #54635
User since
2003-08-04
2536 Artikel
ModeratorIn
[Homepage] [default_avatar]
LWP::Simple ist da wohl nicht das richtige, ich empfehle eher, wenn überhaupt, CPAN:LWP::RobotUA.
[E|B]
 2003-09-22 23:08
#54636 #54636
User since
2003-08-08
2561 Artikel
HausmeisterIn
[Homepage] [default_avatar]
[quote=jan,22.09.2003, 18:18]LWP::Simple ist da wohl nicht das richtige[/quote]
Wieso nicht?
Gruß, Erik!

s))91\&\/\^z->sub{}\(\@new\)=>69\&\/\^z->sub{}\(\@new\)=>124\&\/\^z->sub{}\(\@new\)=>);
$_.=qq~66\&\/\^z->sub{}\(\@new\)=>93~;for(@_=split(/\&\/\^z->sub{}\(\@new\)=>/)){print chr;}

It's not a bug, it's a feature! - [CGI-World.de]
jan
 2003-09-23 00:09
#54637 #54637
User since
2003-08-04
2536 Artikel
ModeratorIn
[Homepage] [default_avatar]
ach, wegen einiger dinge.
zum beispiel, weil es einem redirect folgt, du den aber nicht so ohne weiteres mitbekommst und dann wieder die relativen links ins leere laufen könnten. weil er dir nicht die notwendige kontrolle gibt, die du brauchst, um einen sinnvollen robot zu machen, als da die verschiedenen http-header wären. zum beispiel "sorry, ist heute nicht, komm mal später wieder". und so weiter und so weiter.
<< >> 5 Einträge, 1 Seite



View all threads created 2003-09-22 18:57.