|
Thread Text::Markdown: Markdown+HTML-Mix Probleme vermeiden
(5 answers)
Opened by GwenDragon at 2010-12-18 20:00 2010-12-18T19:00:31 GwenDragon Ich kenne Text:Markdown nicht und hab' gerade keine Lust/Zeit es mir näher anzuschauen.Aber bei ähnlichen Aufgabenstellungen/Problemen habe ich mir angewöhnt den ganzen HTML-Input in HTML::TreeBuilder einzulesen und wieder auszugeben. Dann kommt (fast immer) gültiges HTML raus und ettliche typische Fehler - wie '<' oder '&' als Zeichen im Text oder HTML-Elemente, die nicht geschlossen werden - werden durch recht gute Heuristiken so gefixt, wie es der Schreiber vermutlich wollte. (In Einzelfällen wird das Markup und der Inhalt natürlich trotzdem zerschossen.)Als kleinen Bonus kann man dann recht einfach zusätzliche Filter über den HTML-Tree jagen. Ich begrenze z.B. den Satz zulässiger HTML-Tags, prüfe Links oder stelle den Kontext sicher. |