Thread LWP::UserAgent UTF-8-Mangling die 2991992ste (24 answers)
Opened by Your_name at 2018-10-23 14:29

rosti
 2018-10-24 15:29
#189027 #189027
User since
2011-03-19
3180 Artikel
BenutzerIn
[Homepage]
user image
Liest Du eigentlich was wir hier posten?

Quote
Probier als Layer für dein Filehandle mal ':utf8' anzugeben. Das Ergebnis wird herrlichste Mojibake sein.


Hab ich doch geschrieben was passier: Genau das schaltet die interne Kodierung ab. Und wenn es eine Solche nicht gegeben hat, ist das Ergebnis natürlich unbrauchbar.


use bytes schließlich stellt die Bytesemantic wieder her, Und selbstverständlich ist diese zwingend erforderlich wenn ein Code bytesemantisch arbeiten soll, was gzip, deflate usw. nämlich tun: Sie arbeiten mit Bytes und nicht mit Zeichen, bspw. ist die Anzahl der Bytes nicht gleich der Anzahl der Zeichen!

Wenn $s, intern utf-8-kodiert, eine Zeichenkette ist, liefert length($s) die Anzahl der Zeichen. Wurde die Kodierung jedoch entfernt, liefert length($s) die Anzahl der Bytes.


Sieh auch: http://rolfrost.de/jsbinstr.html

Und ja das kann man alles lernen. Man muss es aber selber machen!

MfG

View full thread LWP::UserAgent UTF-8-Mangling die 2991992ste