Thread Zeichen geht verloren bei Ajax Request? (53 answers)
Opened by bianca at 2012-07-12 05:41

bianca
 2012-07-13 19:56
#159832 #159832
User since
2009-09-13
6980 Artikel
BenutzerIn

user image
2012-07-13T16:00:49 rosti
Wenn nur deutsche Umlaute drin sind, geht die Konvertierung (Iso-8859-1 => UTF-8) zu machen. Daten sichern und los gehts. Du wirst es nicht bereuen, wenn Du alles auf UTF-8 hast. Nimm Encode.pm zum Einmal-Umkodieren mit einem kleinen Script, das ist schnell geschrieben.

OK. Soll ich lieber mit oder ohne BOM verwenden? Tendiere im Moment zu ohne BOM was ich bisher gelesen habe.
Hab mir überlegt, meine beweglichen Dateien (also die Daten, nicht die Scripte selbst) einfach durch ein führendes \x08 zu kennzeichnen, dann weiß ich immer, ob es noch eine alte latin-1 Datei (da fehlt das \x08) oder schon eine neue UTF-8 Datei ist.
Wäre das in deinen Augen OK? Oder ist das \x08 irgendwie anders belegt?

2012-07-13T16:00:49 rosti
Automatische Erkennung der Kodierung? Glücksspiel.

Was hälst du von der Idee mit dem führenden \x08 ?

2012-07-13T16:00:49 rosti
Mach selbst eine Sichtkontrolle mit einem geeigneten Editor, das ist immer noch am Sichersten.

Kann ich vergessen, sind mittlerweile zuviele Dateien. Höchstens Stichproben möglich.

2012-07-13T16:00:49 rosti
Viel Erfolg!

Danke, ich frage zwischendurch mal nach :)

2012-07-13T16:00:49 rosti
PS: Für das Konvertierungs-Script, denke an den <> Diamond-Operator zum Einlesen von Dateien auf der Kommandozeile. Is ja alles nur Text... *G

Frage dazu: Im Moment mache ich das Datei IO komplett mit sysopen() im binmode() obwohl es alles im Grunde ASCII Dateien sind.
Angenommen, ich habe jetzt alle Scripte in UTF-8 gewandelt und gespeichert, dann werden ja alle neuen Dateien vermutlich automatisch auch in UTF-8 angelegt, oder? Oder ist es sinnvoll/zwingend, dass ich beim sysopen() noch eine Kodierung angebe?
Ich möchte ja dann mit dem neuen UTF-8 kodierten Perlscript sowohl alte latin-1 Dateien (erkennbar an dem fehlenden führenden \x08 Byte) als auch neue UTF-8 Dateien lesen und nach Verarbeitung alle in UTF-8 mit führendem Kennzeichnungsbyte wieder schreiben.
10 print "Hallo"
20 goto 10

View full thread Zeichen geht verloren bei Ajax Request?