Thread Zeichenlänge von Umlauten (2 answers)
Opened by Der Namenlose at 2013-08-30 11:29

GwenDragon
 2013-08-30 11:42
#169830 #169830
User since
2005-01-17
14510 Artikel
Admin1
[Homepage]
user image
Da sind wohl die Zeichen in UTF kodiert und du verwendest selbst keines.

ein ß ist in ISO-8859-1: \xDF
ein ß ist in UTF-8 eine 2-Byte-Sequenz: \xC39F
http://www.utf8-zeichentabelle.de/unicode-utf8-tab...

Mit Encode::decode('UTF-8', $zeichenkette) kannst du den String itn Perls internes Formt bringen und dann stimmt length wieder.
CPAN:Encode

Test es mal:
Code (perl): (dl )
1
2
3
4
use Encode;

print length('ä'), "\n";
print length Encode::decode("UTF-8", "ä"), "\n";

ergibt:
2
1

Last edited: 2013-08-30 18:19:51 +0200 (CEST)
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

View full thread Zeichenlänge von Umlauten