Thread Zeichen ersetzen: UTF - ISO-8859-2/windows-1250?
(10 answers)
Opened by Gast at 2008-01-15 18:45 Gast+2008-01-16 13:28:13--Theoretisch gibt es weitere, irgendwelche alten codepages, evtl. mac-encodings usw. win-1250 und iso-8859-2 sind weitgehend kompatibel. Wenn du nur diese beiden hast und sonst nur noch utf-8, dann kannst du auch Encode::Guess verwenden. QuoteDas wären die Zeichen, die du erwartest. Also a-z, A-Z, und dann noch die tschechischen Zeichen, also 0x011B (e mit caron) und all die anderen. QuoteDas würde bei dir typisch aus einer Datei kommen, denke ich. Also müsstest du da sowas wie $octets_to_analyze = do { open my $fh, $dateiname or die; binmode $fh; <$fh> }; machen. QuoteKlar, aber in einem Perl-Skript würde ich lieber Encode::from_to() verwenden. piconv ist gut für den Gebrauch in der Kommandozeile. Quote |