Thread Surrogate Pairs in UTF-8 auflösen (28 answers)
Opened by barney at 2025-08-14 14:22

barney
 2025-08-15 12:57
#197207 #197207
User since
2008-08-31
223 Artikel
BenutzerIn
[Homepage] [default_avatar]
MIME-Parser sagt dass das Encoding UTF-8 ist. Das ist so in den MIME-Header so deklariert und Perl akzeptiert das CESU-8 ja auch klaglos.

Es ist ja auch so dass die Mail multipart/alternative mit einem text/html und einen text/plain MIME Part ist. Im text/html Part ist dass
😀 - U+1F600 - F0 9F 98 80 - GRINNING FACE
korrekt als UTF-8 kodiert. Ich vermute dass das Mail-Programm beim Erzeugen des Plaintextes aus dem HTML Unsinn gemacht hat.

View full thread Surrogate Pairs in UTF-8 auflösen