Thread Nur tatsächliche Texte aus HTML parsen
(21 answers)
Opened by Nordlicht at 2007-05-09 20:04
[quote=Froschpopo,11.05.2007, 12:12]das ist kein konformes HTML.
< ist ein Umlaut und wird < geschrieben[/quote] Was für ein (X)HTML als Quelle benutzt wird, wurde nicht im Startpost gesagt. Und ein < muss eben nicht immer und überall als < kodiert sein. [quote=murphy,11.05.2007, 13:27]Da man nicht davon ausgehen kann, dass man XHTML bekommt, kann man leider nicht XML::LibXML verwenden[/cpan][/quote]Wieso das? Was soll sich da nicht parsen lassen? Das Risiko, dass es schlecht balancierten oder gar ungültigen Quell-Code gibt, ist doch sowieso vorhanden.\n\n <!--EDIT|GwenDragon|1179047348--> |