Thread Probleme mit Umlauten... (15 answers)
Opened by renee at 2004-01-08 10:02

format_c
 2004-01-08 11:59
#784 #784
User since
2003-08-04
1706 Artikel
HausmeisterIn
[Homepage] [default_avatar]
Also was ich jetzt so gelesen hatte, ist das wohl ein Laster das wir als Benutzer des Latin-Zeichensatzes haben.
Beim einlesen mittels XML::Simple werde Umlaute und Sonderzeichen wie ¤ in UTF-8 (\x{20AC}) umgewandelt. Man muss es dann entweder wieder direkt in das Zeichen zurücktransformieren:
Code: (dl )
1
2
use Unicode::String;
$string = Unicode::String::utf8($string)->latin1();


Oder noch besser man wandelt die Sonderzeichen gleich in HTML-ASCII-Werte um:
Code: (dl )
1
2
3
use utf8;

s/([\x{80}-\x{FFFF}])/'&#' . ord($1) . ';'/gse;


Eine direkte Lösung über XML::Simple habe ich nicht finden können und bezweifle auch das es soetwas gibt.

Gruß Alex

View full thread Probleme mit Umlauten...