Thread Charsetproblem: utf8 zu HTML-Codierung (28 answers)
Opened by Gast at 2005-07-20 23:46

pKai
 2005-07-21 20:03
#56545 #56545
User since
2005-02-18
357 Artikel
BenutzerIn
[default_avatar]
@esskar: Eingangsvoraussetzungen sind schon ungleich. Wenn ich mein Skript wie oben zitiert auf der cmd TYPEn lassen, ist das A-Tilde schon was anderes in der Anzeige.
Wenn ich das dann copiere und als Perl-Input paste passiert folgendes:
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
D:\temp>perl
use Encode ();
use HTML::Entities ();

local $\ = $/;

my $data = 'f&├&¼r';
HTML::Entities::decode($data);
print $data;
Encode::from_to($data, "utf8", "iso-8859-1");
print $data;
HTML::Entities::encode($data);
print $data;
^Z
f&├&╝r
f&ⁿr
für

NB: Die UTF-16-Zeichen &├ und &╝ sind (in der Anzeige) Strichgrafikzeichen und &ⁿ ist das kleine hochgestellte n, das übliche Zeichen für ein CP1251-ü in einer CP851-Darstellung.

Edit: 2151 -> 1251\n\n

<!--EDIT|pKai|1121961879-->
I sense a soul in search of answers.

View full thread Charsetproblem: utf8 zu HTML-Codierung