Thread Daten zwischen zwei Ausdrücken drucken (9 answers)
Opened by MisterL at 2009-04-20 17:59

hlubenow
 2019-11-22 15:49
#190922 #190922
User since
2009-02-22
875 Artikel
BenutzerIn
[default_avatar]
Unter Python verwende ich dafür immer ein Modul genannt "BeautifulSoup".
Wenn ich nach einem Pendant für Perl google, empfehlen die meisten ein Perl-Modul namens HTML::TreeBuilder::XPath.
Damit komme ich so zu einem Ergebnis:
Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
#!/usr/bin/perl

use warnings;
use strict;

use HTML::TreeBuilder::XPath;

my $s = getHTMLString();
my $tree= HTML::TreeBuilder::XPath->new;
$tree->parse($s);
my @a = $tree->findnodes_as_strings ('//td');
for my $i (@a) {
    print "$i\n",
}


sub getHTMLString {
    return q(<html>
<body>
<head>
<TITLE>
Testseite
</TITLE>
</head>
<table width="400" style="border-collapse: collapse" bordercolor="#B3B3C1" cellpadding="0" border="1" cellspacing="0">

<tr>
<td height=25 valign=middle  bgcolor="#336699">&nbsp;&nbsp;<font color="#FFFFFF">Aktivität </font> </td>

<td height=25 valign=middle  bgcolor="#F4F4F4">&nbsp;&nbsp; <b>Doktor</b></td>
</tr>

<tr>
<td height=25 valign=middle  bgcolor="#336699">&nbsp;&nbsp;<font color="#FFFFFF">Land </font> </td>
<td height=25 valign=middle  bgcolor="#F4F4F4">&nbsp;&nbsp; <b>Deutschland&nbsp; </b>&nbsp;...</td>
</tr>
</table>
</body></html>);
}

Problematisch ist dieses '//td'. Das ist wohl so eine besondere XPath-Selector-Sprache, mit der ich mich nicht auskenne.

View full thread Daten zwischen zwei Ausdrücken drucken