Thread Surrogate Pairs in UTF-8 auflösen (28 answers)
Opened by barney at 2025-08-14 14:22

rosti
 2025-08-17 19:33
#197224 #197224
User since
2011-03-19
3688 Artikel
BenutzerIn
[Homepage]
user image
Schön wenns geht. Und: Es funktioniert nicht nur mit WTF-UTF-8 (wo Surrogate drin sind) sondern auch mit UTF-8 wo keine Surrogate drin sind.

Im Unicode sind Surrogate auch dokumentiert:
http://rolfrost.de/ucdata.html?cat=Cs

general_category: Cs

und die liegen allesamt zwischen D800 - DFFF, in diesem Bereich gibt es also keine regulären Codepoints

http://rolfrost.de/ucdata.html?cpvon=D800&cpbis=DF...

MSG
.
http://blog.rolfrost.de/

The art of steam.

View full thread Surrogate Pairs in UTF-8 auflösen