Thread XML::LibXML + HTML::TreeBuilder sollen Parsen abbrechen bei defektem HTML (19 answers)
Opened by bikus at 2010-05-04 16:21

esskar
 2010-05-04 23:31
#136805 #136805
User since
2003-08-04
7321 Artikel
ModeratorIn

user image
hmm.
wozu das ganze. wenn du x seiten hast, die du parsen musst, und die alle gut gehen, kann es natürlich sein, dass du bei der x+1 Seite nen Problem feststellst. Vorallem, wenn dir die Parsing methoden egal sind.

nimm einfach eins und arbeite solange damit, bis du auf ein problem stösst.
behandelte fehler und ausnahmen entsprechend gut, so dass du auch nach einem jahr produktiven einsatz darauf arfmerksam gemacht wirst, und gut ist.

module/software kann IMMER irgendwo nen bug haben. die anszahl der möglichen html/xml/sgml dokumente sind unendlich, von daher gibt es eh keine antwort auf deine frage. PROST.

View full thread XML::LibXML + HTML::TreeBuilder sollen Parsen abbrechen bei defektem HTML