Thread Best practice UTF-8 Output (35 answers)
Opened by bianca at 2013-11-29 07:03

GwenDragon
 2013-12-15 10:11
#172595 #172595
User since
2005-01-17
14548 Artikel
Admin1
[Homepage]
user image
Du schreibst in msg #172364
2013-12-02T11:49:25 bianca
Auch das Script selbst ist in ANSI gespeichert im Notepad++.

Es kann aber sein, dass z.B. Umlaute aus Benutzereingaben oder anderen Dateien (alle in latin1) hinein kommen. Und die Datei muss UTF-8 sein,
So ein Durcheinander? Vielleicht auch noch Latin9 (ISO-8559-15) dazu? Du hast also einen Sourcecode, der Windows-1252 (was von Windowslern "ANSI" genannt wird) ist, Benutzeringaben die Latin1/9 (ISO-8559-1/15) sind? Und die sollen UTF-8 gespeichert werden?

Da musst du erst mal deine Benutzereingaben/andere Dateien in eine Zeichenkette lesen, die von Latin1 -> UTF-8 wandeln mit Encode::from_to. Dann anstatt in eine Datei in eine Zeichenkette (open mit \$ZEICHENKETTE) ausgeben und die dann mit Encode::encode nach UTF-8 wandeln. Und dann die Zeichenkette in die Ausgabedatei.

Es ist eben nicht einfach Uraltprogramme aus Windows oder Latin1-Zeiten eben mal umzukodieren.
Last edited: 2013-12-15 10:13:44 +0100 (CET)
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

View full thread Best practice UTF-8 Output