Schrift
[thread]10046[/thread]

Unicode

Leser: 23


<< |< 1 2 3 >| >> 26 Einträge, 3 Seiten
ptk
 2007-08-12 20:38
#98006 #98006
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
codepoint > 255: &#262;
ptk
 2007-08-12 20:54
#98008 #98008
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
euro hack by browsers: €
GwenDragon
 2007-08-12 21:16
#98009 #98009
User since
2005-01-17
14532 Artikel
Admin1
[Homepage]
user image
&#8222;&#8220;
»« &#8218;&#8217; &#8218;&#8216;

:( geht auch nicht.
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

GwenDragon
 2007-08-12 21:17
#98010 #98010
User since
2005-01-17
14532 Artikel
Admin1
[Homepage]
user image
1 &#8364; für 5 Øre, das wäre schön.
Nö Euro zeichen geht nicht.
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

ptk
 2007-08-12 22:19
#98011 #98011
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
Euro-Zeichen gehen nur bei Browsern, die etwas tricksen (z.B. Mozilla). Korrekte Browser machen gar nichts. Der Dillo verhindert sogar die Eingabe von Zeichen, die vom Formular nicht bearbeitet werden können.
ptk
 2007-08-12 22:20
#98012 #98012
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
Und es wird ein "falsches" Euro-Zeichen (0x80), da in iso-8859-1 gar kein Euro-Zeichen definiert ist.
kristian
 2007-08-13 03:40
#98017 #98017
User since
2005-04-14
684 Artikel
BenutzerIn
[Homepage] [default_avatar]
Hallo

ptk+2007-08-12 20:20:18--
Und es wird ein "falsches" Euro-Zeichen (0x80), da in iso-8859-1 gar kein Euro-Zeichen definiert ist.


Vergiss ISO-8859-1, es benutzen eh alle ne Dose...

MS macht da teils komische Dinge...
1252 != iso-8859-1
Die eigentlich reservierten Zeichen 128 - 159 sehen (Auszug einer Routine die 1252 nach UTF-8 umsetzt) so aus:
Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
    $self->{'utf_8_sign'}->{chr('128')} = '&#8364;';
    $self->{'utf_8_sign'}->{chr('130')} = '&#8218;';
    $self->{'utf_8_sign'}->{chr('131')} = '&#402;';
    $self->{'utf_8_sign'}->{chr('132')} = '&#8222;';
    $self->{'utf_8_sign'}->{chr('133')} = '&#8230;';
    $self->{'utf_8_sign'}->{chr('134')} = '&#8224;';
    $self->{'utf_8_sign'}->{chr('135')} = '&#8225;';
    $self->{'utf_8_sign'}->{chr('136')} = '&#710;';
    $self->{'utf_8_sign'}->{chr('137')} = '&#8240;';
    $self->{'utf_8_sign'}->{chr('138')} = '&#352;';
    $self->{'utf_8_sign'}->{chr('139')} = '&#8249;';
    $self->{'utf_8_sign'}->{chr('140')} = '&#338;';
    $self->{'utf_8_sign'}->{chr('145')} = '&#8216;';
    $self->{'utf_8_sign'}->{chr('146')} = '&#8217;';
    $self->{'utf_8_sign'}->{chr('147')} = '&#8220;';
    $self->{'utf_8_sign'}->{chr('148')} = '&#8221;';
    $self->{'utf_8_sign'}->{chr('149')} = '&#8226;';
    $self->{'utf_8_sign'}->{chr('150')} = '&#8211;';
    $self->{'utf_8_sign'}->{chr('151')} = '&#8212;';
    $self->{'utf_8_sign'}->{chr('152')} = '&#732;';
    $self->{'utf_8_sign'}->{chr('153')} = '&#8482;';
    $self->{'utf_8_sign'}->{chr('154')} = '&#353;';
    $self->{'utf_8_sign'}->{chr('155')} = '&#8250;';
    $self->{'utf_8_sign'}->{chr('156')} = '&#339;';
    $self->{'utf_8_sign'}->{chr('159')} = '&#376;';


Ein Euro sieht so aus:
Code (perl): (dl )
$self->{'utf_8_win_euro'} = join("", chr('226'), chr('130'), chr('172'));


Wenn du also von ISO äh 1252 auf UTF-8 willst nimmst du die Tabelle...
wobei der "alte" Euro chr(128) ist.

Gruss
Kristian
ptk
 2007-08-13 10:11
#98018 #98018
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
MS macht keine komischen Dinge. Windows-1252 aka cp1252 ist ein ganz normaler Zeichensatz, wie ISO-8859-1 auch. Blöd ist nur, dass viele Programme meinen, sie benutzen iso-8859-1, aber es ist in Wirklichkeit Windows-1252 (insbesondere Mailprogramme).

Wozu gibt's eigentlich die Routine? CPAN:Encode kann doch alles umkodieren...
Gast Gast
 2007-08-13 12:14
#98029 #98029
Quote
Vergiss ISO-8859-1, es benutzen eh alle ne Dose...

Und es benutzt sicherlich nicht jeder Windows...

Quote
Blöd ist nur, dass viele Programme meinen, sie benutzen iso-8859-1, aber es ist in Wirklichkeit Windows-1252 (insbesondere Mailprogramme).

Wenn einem Programm selber nicht genau mitgeteilt wird um welchen Zeichensatz es sich handelt, dann kann er ja auch nicht wissen ob es nun iso-8859-1, windows 1252 oder utf-8 ist.

Anonsten nutzen viele Webbrowser Windows-1252 auch wenn explizit iso-8859-1 gefordert wird. Wodurch man dann auch hier ein € Zeichen sehen kann.
sid burn
 2007-08-13 12:15
#98030 #98030
User since
2006-03-29
1520 Artikel
BenutzerIn

user image
Bäh, dieses nicht angemeldet Posten nervt mich jetzt schon wieder...
Nicht mehr aktiv. Bei Kontakt: ICQ: 404181669 E-Mail: perl@david-raab.de
<< |< 1 2 3 >| >> 26 Einträge, 3 Seiten



View all threads created 2007-08-12 20:38.