Thread [Tk] File auswählen unicode (31 answers)
Opened by welle at 2013-11-01 20:07

payx
 2013-11-06 13:04
#171856 #171856
User since
2006-05-04
561 articles
BenutzerIn

user image
Hallo GUIfreund,

2013-11-06T11:52:30 GUIfreund
Kennst du einen zuverlässigen Weg, wie ich die Kodierung eines vorhandenen Strings feststellen kann?

Den kann es naturgemäß nicht geben, weil z.B. ein ASCII-String in fast allen Kodierungen gleich ist. Um eine Zeichenfolge mit nicht-ASCII-Zeichen einer Kodierung zuordnen zu können, müsste man wissen, welche Zeichen das sein sollen. In einer 8-Bit-Kodierung kann beispielsweise derselbe Codepoint mal ein Ä oder ein (kyrillisches) Д sein usw.

Es gibt CPAN:Encode::Guess, das die Kodierung zu erraten versucht, wie der Name schon sagt.

Wenn man eine ganze Datei hat, kann es sein, dass sie am Anfang einen Wikipedia:Byte Order Mark (BOM) hat; daran kann das Encoding zuverlässig erkannt werden.

HTH
Grüße
payx

View full thread [Tk] File auswählen unicode