Thread Nur tatsächliche Texte aus HTML parsen (21 answers)
Opened by Nordlicht at 2007-05-09 20:04

ptk
 2007-05-13 12:26
#29010 #29010
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
[quote=murphy,11.05.2007, 13:27]Um wieder zum eigentlichen Thema zurückzukommen: Würde es sich für so eine Aufgabe nicht lohnen, auf das geparste HTML zum Beispiel mit XPath / XQuery loszugehen?[/quote]
XPath wäre auch mein Favorit. Da man nicht davon ausgehen kann, dass man XHTML bekommt, kann man leider nicht XML::LibXML verwenden, aber vielleicht lohnt ein Blick auf die Kombination aus HTML::Parser und XPath: CPAN:HTML::TreeBuilder::XPath

View full thread Nur tatsächliche Texte aus HTML parsen