Thread XML::LibXML + HTML::TreeBuilder sollen Parsen abbrechen bei defektem HTML (19 answers)
Opened by bikus at 2010-05-04 16:21

topeg
 2010-05-04 17:31
#136738 #136738
User since
2006-07-10
2611 Artikel
BenutzerIn

user image
Vom Quelltext her ist die Seite ganz ok.
Ich habe keine Beispiel zur Hand, aber ich meine auf Facebook gäbe es den schlimmsten HTML-Code

aber hier kann man mal schauen was die Parser so daraus machen:
http://www.trentmueller.com/Top-10-Websites-with-t...

View full thread XML::LibXML + HTML::TreeBuilder sollen Parsen abbrechen bei defektem HTML