Thread Problem mit Zeichensatz bei Ajax Webseite (37 answers)
Opened by bianca at 2018-11-01 15:05

haj
 2018-11-03 02:31
#189098 #189098
User since
2015-01-07
527 articles
BenutzerIn

user image
2018-11-02T06:58:21 bianca
2018-11-02T06:39:30 rosti
Deine Lösung heißt UTF-8. Was Du ja auch wolltest: Eine dauerhafte Lösung!

Nein ist es nicht, weil die Browser über <form...> anders senden. Und das muss bei mir durch den selben Perlcode.
Die Browser, die ich kenne, halten sich bei Formularen an das, was ihnen als accept_charset vorgegeben wurde und codieren den Text dementsprechend. Das muss nicht das gleiche Encoding sein, in dem das Formular selbst abgefasst wurde: Du kannst Deine Webseite in ISO-8859-15 belassen und trotzdem Formulareingaben in UTF-8 verarbeiten. <form action="..." accept-charset="utf-8">

2018-11-02T06:58:21 bianca
Ich habe jetzt meine vorgeschaltete Regex geändert von ~ s/\xA0/ /g in ~ s/([^\xC3]?+)\xA0/$1 /g. Schauen wir mal, wann ich darüber stolpere.
Hm... Das ist aber dann doch wieder eher ein Workaround als eine Dauerlösung. UTF-8 hat ein paar legale zwei-Byte-Zeichen, deren zweites Byte ein A0 ist, im europäischen Umfeld gibt es das Š ("\xc5\xa0"). Das gibt es auch in ISO-8859-15 ("\xA6"), aber beispielsweise nicht in ISO-8859-1. Wir sprechen uns dann wieder, wenn Du Dich wunderst, warum ein Š in ein Å umgewandelt wird.

View full thread Problem mit Zeichensatz bei Ajax Webseite