topeg+2008-02-17 17:41:17--my $words=$result->content();
$words =~s/[\r\n]+/ /gs; # Zeilenumbrüche entfernen
$words =~s/<.+?>/ /g; # sehr anfällig. Löscht unter Umständen zu viel / zu wenig
$words =~s/{.+?}/ /g; # wofür ist das? CSS??
$words =~tr/\W\S//d; # Sonderzeichen entfernen
Achtung! tr/// arbeitet nicht mit den Regex-Zeichenklassen! \W ist somit nicht als "alle Nicht-Wortzeichen" zu lesen. So ungern ich das zugebe, aber hier wäre s/// angebrachter, um die Funktionalität von \W und \S zu nutzen.
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!