Thread Zeichensätze UTF-8 -> Latin-1 konvertieren (21 answers)
Opened by Glasperlenspieler at 2011-01-04 09:53

leo11
 2011-01-04 20:42
#144070 #144070
User since
2008-08-14
250 Artikel
BenutzerIn
[default_avatar]
2011-01-04T08:53:51 Glasperlenspieler
UTF-8 nach Win Latin-1 (iso-8859-1) konvertieren.

Dir ist klar, das Win Latin-1 nicht ISO-8859-1 ist?

Quote
Dazu habe ich bisher einfach iconv verwendet,

Probier mal recode. Ich weiß dass es sich anders verhält, das genaue Verhalten jedoch habe ich beim Überfliegen eben in man recode/ info recode nicht finden können. Falls es jemand findet, postet es bitte. Hier ein schneller Test:
Quote
Hexcode 80 is in Windows-1252 das Euro Zeichen.

iconv -f WINDOWS-1252 -t UTF8 win1252_file -o utf8_file
führt zu:
e2 82 ac

iconv -f UTF8 -t ISO-8859-1 utf8_file iso8859-1_file
iconv: illegal input sequence at position 0

recode UTF-8..ISO-8859-1 utf8_file
ergibt
45 55 52 Das sind die Glyphen EUR

Quote
Gibt es denn eine Möglichkeit, irgendwie die Zeichen zu identifizieren, die im Zielzeichensatz nicht enthalten sind? Dann ließen sich dafür im Vorfeld sinnvolle Ersetzungen finden.

Intressante Frage. Wie zuvor schon jemand schrieb: Was soll dann damit passieren?

Bitte poste doch dann mal wie du es gemacht hast.

View full thread Zeichensätze UTF-8 -> Latin-1 konvertieren