Thread use utf8 und Verhalten von String-Operationen (65 answers)
Opened by rosti at 2011-08-03 19:16

rosti
 2011-08-03 13:50
#151057 #151057
User since
2011-03-19
3194 Artikel
BenutzerIn
[Homepage]
user image
2011-08-03T11:43:19 GwenDragon
Wenn du es genau weißt, erkläre doch mal warum die Bytesequenz \303\244 nicht dasselbe wie ä in UTF8 ist.


Moment mal, diese Erklärung ist pq mir schuldig ;)

PS/Edit: Aber ich bin ja ein netter Mensch ;)
/303 ist die Oktettenschreibweise, ergo ist die Zahl dem Oktalsystem entlehnt und ist C3 in hex, bzw. 195 dezimal

Nochn Nachtrag
Code (perl): (dl )
1
2
3
4
5
# Jetzt nehmen wir mal die Bytes , C3 A4 für das Zeichen 'ä'
# beachte Schablone "C", es werden bytes erzeugt
my $str = pack "C*", 0xC3, 0xA4;
# Es ist zu erwarten, das Perl-intern die byte-semantic gilt
print length($str), "\n"; # Und ja: Es stimmt ;)

Last edited: 2011-08-03 14:05:41 +0200 (CEST)

View full thread use utf8 und Verhalten von String-Operationen