Thread regex das speichern kann (24 answers)
Opened by RPerl at 2007-03-24 16:10

Ronnie
 2007-03-25 13:43
#75352 #75352
User since
2003-08-14
2022 Artikel
BenutzerIn
[default_avatar]
RegExen sind zum parsen von HTML wirklich nur bedingt geeignet. Die Frage welche CPAN-Module sinnvoller sind, sollte man ruhig stellen. Hier ein kleines Beispiel zu deiner Problemstellung, das man recht gut aus der Doku zu CPAN:HTML::TokeParser herleiten kann:
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
#!/usr/bin/env perl

use strict;
use warnings;

use HTML::TokeParser;

my $p = HTML::TokeParser->new(shift||"index.html");
while(my $result = $p->get_tag("textarea")) {
if ($result->[1]->{'name'} eq 'report' ) {
my $text = $p->get_trimmed_text;
print "Text:\n\n$text\n";
}
}

HTML:
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta name="generator" content=
"HTML Tidy for Mac OS X (vers 12 April 2005), see www.w3.org" />

<title>Test</title>
</head>

<body>
<form>
<textarea name="dummy" cols="121" rows="15">
Ich bin leer
</textarea>
<textarea name="report" cols="121" rows="15">
Mein Name ist Peter
</textarea>
</form>
</body>
</html>

Ich habe das Modul vorher auch noch nie verwendet. Wenn ich irgendwo einen Haken übersehen habe, bitte kurze Info!

View full thread regex das speichern kann