Thread HTML::Entities - decode_entities() erzeugt kein Unicode sondern Latin1 (40 answers)
Opened by GwenDragon at 2024-03-19 12:49

haj
 2024-03-21 13:59
#195959 #195959
User since
2015-01-07
531 articles
BenutzerIn

user image
2024-03-21T11:38:40 GwenDragon
Hab ich was vergessen?

Ja, aber es ist schwer zu sagen, ob das nur zwecks der Kürze oder systematisch ist.

  • Du musst auch den $term decodieren (oder use CGI '-utf8'; schreiben).
  • Encode::decode ersetzt nicht in-place, Du musst den Rückgabewert wieder auf $content zuweisen.
  • Du prüfst nicht, ob die Datei wirklich korrekt UTF-8-codiert war. "Früher mal" war ISO-8859-1 das Standard-Encoding im Web. Mit Entities läßt sich so jeder Unicode-Character darstellen, aber ein ä geht in ISO-8859-1 auch als ä.

View full thread HTML::Entities - decode_entities() erzeugt kein Unicode sondern Latin1