Thread html-tags per regex entfernen (7 answers)
Opened by Quenten at 2005-03-10 17:55

Quenten
 2005-03-16 17:06
#52526 #52526
User since
2005-02-15
22 Artikel
BenutzerIn
[default_avatar]
Habe nun ein Script, dass seinen Dienst tut und mitterweile verstehe ich auch die Verzweigungen mit der Klasse. Danke an alle die geholfen haben.

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
use HTML::Parser;
my $parser = HTML::Parser->new(
start_h => [ \&_starttag, 'self, tagname, attr' ],
end_h => [ \&_endtag, 'self, tagname' ],
text_h => [ \&_text, 'self, dtext' ]
);

$parser->parse($email_text);

sub _starttag {
my ($self, $tag, $attr) = @_;
$self->{'_body'} = 1 if($tag eq 'body');
}

sub _endtag {
my ($self, $tag) = @_;
$self->{'_body' } = 0 if($tag eq 'body' );
}

sub _text {
my ($self, $dtext) = @_;

$dtext =~ s/\A\s+//;
$dtext =~ s/\s+\z//;
return() unless ( length($dtext) > 0 and $dtext =~ /[^\s]/ );

if ($self->{'_body'} == 1) {
print $dtext;
}
}
\n\n

<!--EDIT|Quenten|1110985600-->

View full thread html-tags per regex entfernen