Thread utf 8: lesen und schreiben von utf8-html-seiten (25 answers)
Opened by Gast at 2005-04-19 21:03

GwenDragon
 2005-04-20 15:19
#53980 #53980
User since
2005-01-17
14848 Artikel
Admin1
[Homepage]
user image
[quote=renee,20.04.2005, 12:53]Wenn es wirklich nur darum geht, die Tags zu löschen, geht es noch einfacher:
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
#!/usr/bin/perl -w

# Extract all plain text from an HTML file

use strict;
use HTML::Parser 3.00 ();

my $html = qq~<html><body>dies ist <b> ein test</b>.<br /><center>Test</center></body></html>~;

sub text
{
  print shift;
}

HTML::Parser->new(api_version => 3, handlers    => [ text  => [\&text, "dtext"], ])->parse($html);
[/quote]
Dein Beispiel habe ich gerade getestet! ;)
Definitiv nein, so geht es nur teilweise.
Wenn du CSS-Styles und Skripte im HTML eingebunden hast, bleiben die Inhalte der Skripte und der Styles im Text.

View full thread utf 8: lesen und schreiben von utf8-html-seiten