Thread Archive::RAR...: treibt mich in den Wahnsinn! (27 answers)
Opened by zipster at 2005-02-15 18:11

ptk
 2005-02-23 17:11
#51774 #51774
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
Unicode ist erstmal nur eine Mapping von Zeichen auf eine Zahl. Dort heisst es, dass A den Code 65 hat und EUR den Code 0x20ac. Da man mit Unicode 2**32 Zeichen damit bezeichnen kann, reicht ein Byte zum Speichern dieses Codes nicht mehr aus (bei ASCII oder ISO-8859-1 hat man nur 256 Zeichen). Aus diesem Grund hat man verschiedene Encodings wie utf-8, utf-16, utf-32 etc. entwickelt. Notepad spuckt wahrscheinlich utf-16 aus. Das erkennt man leicht, wenn bei normalem Text jedes zweites Byte ein Nullbyte ist. Wenn sogar immer drei Nullbytes aufeinanderfolgen, dann ist es hoechstwahrscheinlich utf-32 (wobei es dort meist noch little endian und big endian-Varianten gibt).

View full thread Archive::RAR...: treibt mich in den Wahnsinn!