Thread Zeichen ersetzen: UTF - ISO-8859-2/windows-1250? (10 answers)
Opened by Gast at 2008-01-15 18:45

kristian
 2008-01-16 21:15
#104798 #104798
User since
2005-04-14
684 Artikel
BenutzerIn
[Homepage] [default_avatar]
Hallo

Wenn du eine Perl-Version hast die Unicode kann und dein Betriebssystem Unicode kann - für Vista kann ich die Frage nicht beantworten - ist Perl dein Freund.
Mit Hilfe des Moduls Encode kannst du (fast) alles nach UTF-8 konvertieren.

Code (perl): (dl )
1
2
3
4
5
kristian@tux:~> perl -wle '
use Encode;
my @list = Encode->encodings(":all");
print $_ for @list;
'

7bit-jis
AdobeStandardEncoding
AdobeSymbol
AdobeZdingbat
ascii
ascii-ctrl
big5-eten
big5-hkscs
cp1006
cp1026
cp1047
cp1250
cp1251
cp1252
cp1253
cp1254
cp1255
cp1256
cp1257
cp1258
cp37
cp424
cp437
cp500
cp737
cp775
cp850
cp852
cp855
cp856
cp857
cp860
cp861
cp862
cp863
cp864
cp865
cp866
cp869
cp874
cp875
cp932
cp936
cp949
cp950
dingbats
euc-cn
euc-jp
euc-kr
gb12345-raw
gb2312-raw
gsm0338
hp-roman8
hz
iso-2022-jp
iso-2022-jp-1
iso-2022-kr
iso-8859-1
iso-8859-10
iso-8859-11
iso-8859-13
iso-8859-14
iso-8859-15
iso-8859-16
iso-8859-2
iso-8859-3
iso-8859-4
iso-8859-5
iso-8859-6
iso-8859-7
iso-8859-8
iso-8859-9
iso-ir-165
jis0201-raw
jis0208-raw
jis0212-raw
johab
koi8-f
koi8-r
koi8-u
ksc5601-raw
MacArabic
MacCentralEurRoman
MacChineseSimp
MacChineseTrad
MacCroatian
MacCyrillic
MacDingbats
MacFarsi
MacGreek
MacHebrew
MacIcelandic
MacJapanese
MacKorean
MacRoman
MacRomanian
MacRumanian
MacSami
MacSymbol
MacThai
MacTurkish
MacUkrainian
MIME-B
MIME-Header
MIME-Header-ISO_2022_JP
MIME-Q
nextstep
null
posix-bc
shiftjis
symbol
UCS-2BE
UCS-2LE
UTF-16
UTF-16BE
UTF-16LE
UTF-32
UTF-32BE
UTF-32LE
UTF-7
utf-8-strict
utf8
viscii


Die Doku zu Encode hilft übringends ungemein, wenn man verstehen will oder muss, was da abgeht.
Sag uns mal noch ein Wort zu deiner Perlversion, ich vermute die kommt von ActiveState?
"perl -v" sagt es dir.

Latin 2 ist nur ein anderer Name für ISO-8859-2, MS hat immer ein eigenes Plazebo für jeden Zeichensatz, in vielen Fällen waren die Anfangs identisch hatten nur andere Namen.

Gruss
Kristian

View full thread Zeichen ersetzen: UTF - ISO-8859-2/windows-1250?