Thread Webseite bestimmte Werte auslesen (12 answers)
Opened by Willi9974 at 2020-03-07 09:08

Daxim
 2020-03-10 08:10
#191457 #191457
User since
2007-08-01
114 Artikel
BenutzerIn
[Homepage]
user image
Die API von TreeBuilder saugt Eselschwänze. CPAN:Web::Query ist um Größenordnungen einfacher zu bedienen. Illustration, ungetestet:

Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
use Web::Query::LibXML 'wq';

my $post_wrapper =
    wq('https://www.perl-community.de/bat/poard/thread/20750')
    ->find('div.author > a:contains("clms")')
    ->parent->parent;

my $posting = $post_wrapper->find('.posting_content');
$posting->find('blockquote')->remove;
my $post_text = $posting->text;

my @permalinks;
$post_wrapper->find('.anchor a')->each(sub {
    push @permalinks, $_->attr('href');
});

View full thread Webseite bestimmte Werte auslesen