Thread HTML-Parser und leere Elemente (3 answers)
Opened by GwenDragon at 2008-01-25 13:02

GwenDragon
 2008-01-25 13:02
#105150 #105150
User since
2005-01-17
14611 Artikel
Admin1
[Homepage]
user image
Ich will mit CPAN:HTML-TagFilter bestimmte Elemente von HTML filtern.

Jetzt habe ich aber das Problem, dass es mir aus XHTML bzw. Elementen, die auch wieder imlicit geschlossen sind, HTML macht.
Das bedeutet, dass aus
Code: (dl )
<img src=test.jpg />
dann
Code: (dl )
<img src="test.jpg">
wird, was natürlich falsch ist.
Es muss dann nämlich
Code: (dl )
<img src="test.jpg" />
sein!

In der Doku zu HTML-Parser steht, dass:
Quote
Empty element tags look like start tags, but end with the character sequence "/>" instead of ">". When recognized by HTML::Parser they cause an artificial end event in addition to the start event. The text for the artificial end event will be empty and the tokenpos array will be undefined even though the the token array will have one element containing the tag name.


Wie kann ich das am besten lösen, dass mir das implizite Schließen des Elements nicht verloren geht?

View full thread HTML-Parser und leere Elemente