Thread altägyptische regex (32 answers)
Opened by lichtkind at 2010-04-15 03:57

Taulmarill
 2010-04-16 13:24
#136173 #136173
User since
2004-02-19
1750 Artikel
BenutzerIn

user image
Man könnte nach dem Schema n Bit mit Wert 1 und ein abschließendes Bit mit Wert 0 die Anzahl der Bytes der Sequenz aber auch über das erste Octet hinaus fortsetzen.

Sicher, das ist wahrscheinlich nirgendwo implementiert. Außerdem steht auch bei 8 Byte viel mehr zur Verfügung, als wohl jemals gebraucht werden wird (so was wurde allerdings damals auch über IPv4 gesagt). Es ging mir nur darum, dass das Prinzip, nach dem UTF-8 arbeitet, keine eingebaute Obergrenze hat, sondern die RFC nur deswegen nach nach 4 Byte Schluss macht, weil das im Moment eh für alles absehbare reicht.
$_=unpack"B*",~pack"H*",$_ and y&1|0& |#&&print"$_\n"for@.=qw BFA2F7C39139F45F78
0A28104594444504400 0A2F107D54447DE7800 0A2110453444450500 73CF1045138445F4800 0
F3EF2044E3D17DE 8A08A0451412411 F3CF207DF41C79E 820A20451412414 83E93C4513D17D2B

View full thread altägyptische regex