Schrift
[thread]7145[/thread]

Charsetproblem: utf8 zu HTML-Codierung (Seite 3)

Leser: 5


<< |< 1 2 3 >| >> 29 Einträge, 3 Seiten
GwenDragon
 2005-07-21 17:38
#56540 #56540
User since
2005-01-17
14837 Artikel
Admin1
[Homepage]
user image
Was für ein Browser übergibt dir so einen Mist?
Bei UTF8 braucht es kein &...;!

Woher kommen die Daten?
pKai
 2005-07-21 17:44
#56541 #56541
User since
2005-02-18
357 Artikel
BenutzerIn
[default_avatar]
Ich schließe mich meiner Vorrednerin an...

Abgesehen davon, funktioniert unter den Umständen das folgende bei mir
Code: (dl )
1
2
3
4
5
6
7
my $data = 'fÃ&¼r'; # so gemeint, wie's da steht
HTML::Entities::decode($data);
print $data;
Encode::from_to($data, "utf8", "iso-8859-1");
print $data;
HTML::Entities::encode($data);
print $data;

Wenn ich die Funktionsaufrufe direkt ineinander einsetzen klappts aber schon nicht mehr.
DWIM bzgl UTF8 scheint dann ein Problem zu sein?!
I sense a soul in search of answers.
GreenRover
 2005-07-21 19:15
#56542 #56542
User since
2005-07-20
11 Artikel
BenutzerIn
[default_avatar]
kein Browser!!!! das google API!!!!

Danke pKai es funktioniert endlich!!!!!

THX THX THX\n\n

<!--EDIT|GreenRover|1121959225-->
esskar
 2005-07-21 19:24
#56543 #56543
User since
2003-08-04
7321 Artikel
ModeratorIn

user image
warum schreisst du so? wir wollen dir nur helfeN, wenn du es besser kannst, lös dein problem doch allein!
esskar
 2005-07-21 19:28
#56544 #56544
User since
2003-08-04
7321 Artikel
ModeratorIn

user image
hmm;

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
use HTML::Entities;
use Encode;
my $data = 'fÃ&¼r'; # so gemeint, wie's da steht
HTML::Entities::decode($data);
print $data, "\n";
Encode::from_to($data, "utf8", "iso-8859-1");
print $data, "\n";
HTML::Entities::encode($data);
print $data, "\n";
^Z
fÃ&╝r
f?r
f?r
pKai
 2005-07-21 20:03
#56545 #56545
User since
2005-02-18
357 Artikel
BenutzerIn
[default_avatar]
@esskar: Eingangsvoraussetzungen sind schon ungleich. Wenn ich mein Skript wie oben zitiert auf der cmd TYPEn lassen, ist das A-Tilde schon was anderes in der Anzeige.
Wenn ich das dann copiere und als Perl-Input paste passiert folgendes:
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
D:\temp>perl
use Encode ();
use HTML::Entities ();

local $\ = $/;

my $data = 'f&├&¼r';
HTML::Entities::decode($data);
print $data;
Encode::from_to($data, "utf8", "iso-8859-1");
print $data;
HTML::Entities::encode($data);
print $data;
^Z
f&├&╝r
f&ⁿr
f&uuml;r

NB: Die UTF-16-Zeichen &├ und &╝ sind (in der Anzeige) Strichgrafikzeichen und &ⁿ ist das kleine hochgestellte n, das übliche Zeichen für ein CP1251-ü in einer CP851-Darstellung.

Edit: 2151 -> 1251\n\n

<!--EDIT|pKai|1121961879-->
I sense a soul in search of answers.
GwenDragon
 2005-07-21 20:18
#56546 #56546
User since
2005-01-17
14837 Artikel
Admin1
[Homepage]
user image
Wenn sich doch so mancher etwas genauer mit den verschieden Zeichenencodings auf den Systemen beschäftigen würde.

DOS != Windows != Mac != UTF8 etc.
ptk
 2005-07-21 23:03
#56547 #56547
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
[quote=GwenDragon,21.07.2005, 15:38]Was für ein Browser übergibt dir so einen Mist?
Bei UTF8 braucht es kein &...;!

Woher kommen die Daten?[/quote]
Alle Browser, die eine Seite mit Content-Type:iso-8859-1 sehen und auf der in einem Inputfeld nicht-ISO-8859-1-Zeichen eingegeben werden. machen so einen Quatsch. Fuer diesen Fall hat der HTML-Standard naemlich nichts vorgesehen, und Browser versuchen, das Beste daraus zu machen. Dabei kann auch ein &#....; entstehen.
GwenDragon
 2005-07-22 15:13
#56548 #56548
User since
2005-01-17
14837 Artikel
Admin1
[Homepage]
user image
@ptk
Das Browser, die eine Latin-1 Seite mit nicht Latin-1 Zeichen als &Entität kodieren weiß ich.
Ich wollte nur von GreenRover wissen, wieso er UTF8 bekommt mit solchen &#-Entities!
<< |< 1 2 3 >| >> 29 Einträge, 3 Seiten



View all threads created 2005-07-20 23:46.