Thread Surrogate Pairs in UTF-8 auflösen (28 answers)
Opened by barney at 2025-08-14 14:22

haj
 2025-08-14 19:40
#197199 #197199
User since
2015-01-07
582 Artikel
BenutzerIn

user image
Das sieht mir nach dem WTF-8-Encoding aus, wobei WTF nicht das übliche bedeutet, sondern "Wobbly Transformation Format". Microsoft ist wieder mal nicht ganz unbeteiligt.

Die Theorie: https://simonsapin.github.io/wtf-8/
Auf CPAN: CPAN:UTF8::R2 soll das wohl können, aber ich bin mal zu faul zum testen :)

View full thread Surrogate Pairs in UTF-8 auflösen