Thread HTML::PrettyPrinter zerschiesst HTML-Entities (3 answers)
Opened by Britzel at 2014-07-04 00:22

clms
 2014-07-04 11:28
#176296 #176296
User since
2010-08-29
373 Artikel
BenutzerIn
[default_avatar]
Meine Erfahrung:
Der Fehler hat nichts mit HTML::PrettyPrinter selbst zu tun, sondern passiert spätestens beim Einlesen des HTML-Codes in den HTML::Element Tree.
Das kannst du überprüfen, indem Du den HTML::Element-Tree direkt (ohne HTML::PrettyPrinter) dumpst - die Methode ist AFAIK as_HTML().

Oder Du schaust Dir die Textstrings im HTML-Tree direkt an. Da ist das MDASH sicher schon zu — escaped, so dass beim Export nach HTML nur '&" als Sonderzeichen erkannt - und durch die Entity & ersetzt wird. Für die Ausgabe, die Du haben willst, müsste in den Text-Strings das Unicode-Zeichen für MDASH stehen.

View full thread HTML::PrettyPrinter zerschiesst HTML-Entities