Thread Regex - Suche nach Tags (7 answers)
Opened by YAPD at 2021-06-01 18:31

YAPD
 2021-06-01 21:05
#193340 #193340
User since
2015-09-20
146 articles
BenutzerIn

user image
Hi Linuxer,

vielen Dank für deine Antwort. Ich habe jetzt schon einiges ausprobiert,
aber ich komme einfach nicht zum gewünschten Ergebnis.

Das ist der Beispiel Code :

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
use strict;
use warnings;

use HTML::TreeBuilder;
use Data::Dump qw(dd);

use HTML::TokeParser;

use LWP 5.64; # Loads all important LWP classes, and makes
# sure your version is reasonably recent.

my $browser = LWP::UserAgent->new;

# Then later, whenever you need to make a get request:
my $url = "https://www.imdb.com/find?s=tt&q=Butterfly+Effect&ref_=nv_sr_sm";

my $response = $browser -> get( $url );

my $content = $response -> content_ref;

my $p = HTML::TokeParser-> new( $content );

$p -> { textify } -> { img } = "alt";

my %test = %{ $p -> { textify } };

foreach my $t( %test )
{
#print $t;
}

#$p = {img => "alt", applet => "alt"};

while (my $token = $p->get_tag("a"))
{
my $url2 = $token->[1]{href} || "-";
my $text2 = $p->get_trimmed_text("/tr");
print "$url2\t$text2\n";
}


Wenn ich den o.g. Code ausführe, bekomme ich:

Code: (dl )
/title/tt7059534/       [IMG] Butterfly Effect (2017) (Short)


Das Problem ist, dass der HTML Code für diese Zwecke wohl
ungünstig geschrieben ist. Auf dem angehängten Bild seht
ihr, wie der Code aussieht.

Ich habe bereits herausgefunden, dass dies mit dem Schalter
{ Textify } zu tun hat, leider zeigt er mir immer nur "IMG"
an, anstatt die URL zum Bild.

Beste Grüße
YAPD
Attachments
image/png
946 x 241
Snippet.PNG

Last edited: 2021-06-01 21:15:07 +0200 (CEST)
Yet Another Perl Developer

View full thread Regex - Suche nach Tags