Thread Zeichensatzproblem mit Š (15 answers)
Opened by bianca at 2019-06-07 19:07

haj
 2019-06-07 20:47
#190103 #190103
User since
2015-01-07
527 Artikel
BenutzerIn

user image
2019-06-07T17:07:51 bianca
Das kleine š mit \250 ist richtig aber wieso ist das große Š falsch? Da erwarte ich ein \246.
Wo entsteht dieser Fehler?

Ich tippe auf eine falsche Reihenfolge beim dekodieren: Die Bytefolge des großen Š ist (hex) C5 A0. Das A0 ist, als Byte interpretiert, wie das Pech es so will, der Wert des NBSP (non-breaking-space), und wir sehen ja auch ein Leerzeichen nach dem \305 in der Ausgabe des Data::Dumper. Irgendwer interpretiert die Daten byte-weise und wandelt das NBSP in ein normales Blank um, bevor Du mit Deinem UTF8-Dekodieren zum Zug kommst.

Wenn Du den Sündenbock nicht findest, der das vermeintliche NBSP in ein Leerzeichen verwandelt:
Schau' Dir in der CGI-Dokumentation mal das Pragma -utf8 an: Damit übernimmt CGI das Dekodieren, hoffentlich bevor das NBSP in ein Leerzeichen umgewandelt wird. Dann darfst Du selbst natürlich nicht mehr dekodieren.

View full thread Zeichensatzproblem mit Š