Thread Links extrahieren (5 answers)
Opened by Mary at 2006-09-22 21:45

Mary
 2006-09-23 14:15
#28643 #28643
User since
2006-06-25
17 Artikel
BenutzerIn
[default_avatar]
Danke! Das Beispiel aus dem Artikel ist schon mal hilfreich:

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#! /usr/bin/perl
use strict;
use warnings;
use HTML::Parser;

my @links;
my $file = "my_file.html";

my $p = HTML::Parser->new();
$p->handler(start => \&start_handler,"tagname,attr,self");
$p->parse_file($file);

foreach my $link(@links){
 print "Linktext: ",$link->[1],"\tURL: ",$link->[0],"\n";
}

sub start_handler{
 return if(shift ne 'a');
 my ($class) = shift->{href};
 my $self = shift;
 my $text;
 $self->handler(text => sub{$text = shift;},"dtext");
 $self->handler(end => sub{push(@links,[$class,$text]) if(shift eq 'a')},"tagname");
}


Und wie kann ich diesen Skript anpassen, um die Links wie
Code: (dl )
<a class="res" href="http://...">
zu extrahieren? Ich kriege es leider nicht selber hin.

Lg
Mary

View full thread Links extrahieren