Thread altägyptische regex (32 answers)
Opened by lichtkind at 2010-04-15 03:57

moritz
 2010-04-16 12:01
#136171 #136171
User since
2007-05-11
923 Artikel
HausmeisterIn
[Homepage]
user image
2010-04-16T09:23:32 Taulmarill
So, wie UTF-8 arbeitet, ließe sich ein Zeichen auch mit beliebig vielen Octets Codieren.


Nein. Das erste Byte einer Multibytesequenz kodiert, wie viele Bytes in dieser Sequenz sind, d.h. wenn das erste Byte mit der Bitmuster 1110 anfaengt, ist die Sequenz drei Byte lang.

Also kann eine Multibytesequenz maximal 8 bytes enthalten, die sieben Folgebytes kodieren dann ja 6 bit, also stehen 7*6 = 42 bit "payload" zur Verfuegung. Das ist wesentlich mehr, als man fuer Unicode braucht, aber auch nicht beliebig viel.

View full thread altägyptische regex