Thread Umlaute finden (6 answers)
Opened by hago at 2018-01-23 08:40

Raubtier
 2018-01-23 08:57
#187944 #187944
User since
2012-05-04
1054 Artikel
BenutzerIn

user image
Bei Umlauten gibt es mehre Dinge zu betrachten:
a) in welcher Kodierung ist dein Perl-Script gespeichert?
b) in welcher Kodierung erfolgt die Eingabe?
c) in welcher Kodierung erfolgt die Ausgabe?

Wenn du "use utf8;" verwendest, zeigst du Perl an, dass du dein Script in utf-8 gespeichert hast (dann sollte das aber auch stimmen und das Script nicht in Windows-1252 gespeichert sein!). Somit wird die üs in deinem Programm (also sowohl bei der Zuweisung an $xx als auch in den Regex) korrekt als solches erkannt.

Dann musst du nur noch Ein- und Ausgabe umwandeln. Die Eingabe mit decode, die Ausgabe mit encode. Ich bin kein Windows-Experte, meine aber mich zu erinnern, dass Windows Codepage 850 verwendet (gibt es "chcp" noch? - gib es einfach mal auf Windows-Kommandozeile ein!)

Hier ein exzellenter Artikel:
https://perlgeek.de/de/artikel/charsets-unicode
Last edited: 2018-01-23 08:59:28 +0100 (CET)

View full thread Umlaute finden