Thread Surrogate Pairs in UTF-8 auflösen (28 answers)
Opened by barney at 2025-08-14 14:22

rosti
 2025-08-15 06:46
#197200 #197200
User since
2011-03-19
3687 Artikel
BenutzerIn
[Homepage]
user image
Interessanterweise kommt JavaScript mit diesen Surrogaten klar:

http://rolfrost.de/encode.html

ED A0 BD ED B8 80 als Binary eingeben, das erzeugt die beiden WTF Codepoints D83D DE00 und auch das Zeichen GRINNING FACE


Also in JS sieht das so aus:

Code: (dl )
1
2
3
4
5
6
7
8
    
out = [0xD83D, 0xDE00]; // die beiden 16-Bit Code-Points für das GRINNING FACE
var chars = '';
for(i = 0; i < out.length; i++){
console.log(i, out[i])
chars += String.fromCodePoint( out[i] );
}
console.log(chars);


Der Browser stellt das GRINNING FACE dar, weil er offensichtlich die Kodierung kennt. Leider verrät die der Browser nicht ;)


.
Last edited: 2025-08-15 13:01:13 +0200 (CEST)
http://blog.rolfrost.de/

The art of steam.

View full thread Surrogate Pairs in UTF-8 auflösen