Thread unicode combined characters nach iso aber wie ? (5 answers)
Opened by perlot at 2012-02-23 16:13

moritz
 2012-02-23 18:48
#156379 #156379
User since
2007-05-11
923 Artikel
HausmeisterIn
[Homepage]
user image
CPAN:Unicode::Normalized hilft tatsächlich. Du brauchst die "composed" Normalform.

Beispiel:

Code: (dl )
1
2
3
4
$ echo -e "\x55\xcc\x88"|utf8-dump 
U\N{COMBINING DIAERESIS}
echo -e "\x55\xcc\x88"| perl -CS -MUnicode::Normalize -pE '$_ = NFC($_)'|utf8-dump
\N{LATIN CAPITAL LETTER U WITH DIAERESIS}


Dabei habe ich zum Anzeigen dieses kleine Helferscript benutzt.

View full thread unicode combined characters nach iso aber wie ?