Zeichen ersetzen: UTF - ISO-8859-2/windows-1250? - #104871 (Allgemeines zu Perl)

ptk

2008-01-17 21:21

User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]

Gast+2008-01-17 15:11:24--
Perl-Version ist v5.10.0 von Activestate.

Die ISO version und die Win-version sind leider nicht identisch für die tschechischen Schriftzeichen.

Stimmt. Ich habe gerade mal ein diff cp1250.ucm 8859-2.ucm gemacht.

Quote
Ist denn windows 1250 das gleiche wie cp1250?

Ja.

Quote
Weil wenn ich Encode::Guess verwende, wird mir ausgegeben, dass er die Schrift nicht erkennt.

Da cp1250 und 8859-2 nicht das gleiche ist, musst du wohl meine Methode verwenden.

Quote
Aber in word (die für mich zur Zeit einzige Möglichkeit den Zeichencode zu checken) öffne ich sie immer mit windows mitteleuropäisch. Bei mitteleuropäischISO werden falsche Zeichen angezeigt.

Um auf mein Anfangsproblem zurückzukommen: das wichtige ist ja, dass die spezifisch Tschechischen Zeichen ersetzt erden können. Dafür habe ich zur Zeit einfach alle zu suchenden zeichen und die Zeichen mit denen sie ersetzt werden sollen in eine Datei geschrieben, die auch in Mitteleuropäisch (Windows) gespeichert ist. Damit funktioniert das für einige der Dateien. Aber andere scheinen eine andere Codierung zu verwenden und dann gehts wiiiieder nicht, deshalb wär es gut das vorher zu prüfen und dann die entsprechende symbol-datei zu verwenden.

Versuch mal meine Methode. Sie sollte für dein Problem perfekt passen.