Thread Unicode (15 answers)
Opened by GwenDragon at 2019-01-21 16:20

haj
 2019-01-23 18:20
#189597 #189597
User since
2015-01-07
527 Artikel
BenutzerIn

user image
Der Browser kann UTF-8, und es steht im Header. Er bekommt die Bytes c3b0 c29f c291 c280, und nachdem er die UTF-8-Dekodierung durchgeführt hat, muss er aus den resultierenden Codepoints was machen. In Windows Codepage 1252 steht Ÿ‘€ genau an den Positonen, die nach dem Dekoderen entstehen.

c3b0 ist ein in Unicode definierter Codepoint (U+00F0) für das ð. Die anderen entsprechen im Iso-Latin-1-Supplement irgendwelchen Kontrollzeichen: c280 oder Codepoint U+0080 ist im Wikipedia:Unicodeblock_Lateinisch-1,_Ergänzung ein PAD, 80 ist in Wikipedia:Windows-1252 ein €.

View full thread Unicode