Thread Datei kein UTF8 (13 answers)
Opened by Froschpopo at 2006-06-11 08:41

Dubu
 2006-06-12 23:22
#67236 #67236
User since
2003-08-04
2145 Artikel
ModeratorIn + EditorIn

user image
[quote=GwenDragon,12.06.2006, 10:50]Es ist nur möglich heraus zu finden, ob eine Textdatei UTF ist, nämlich durch den BOM.
[/quote]
Wobei die "Byte Order Mark" nur bei UTF-16- und UTF-32-Kodierung wichtig ist, bei UTF-8 eigentlich nur von ein paar Windows-Programmen erzeugt wird und bei Skripten und Programmcode tunlichst weggelassen werden sollte, damit sich Interpreter/Compiler daran nicht verschlucken.

Quote
Ob eine Datei iso-8859-1, windows-1252 oder gar iso-8859-15 ist kannst du nicht herausfinden.

Gerade ISO-8859-1 und -15 unterscheiden sich nur in ein paar Zeichen (&¤, &¦, &¨, &´, &˛, &¼, &½, &¾, ¼, ½, ¾ vs. ¤, ¦, ¨, ´, ¸ - mal schauen, wie das hier dargestellt wird).
Wenn die nicht im Text vorkommen, kann man es nicht unterscheiden. Und wenn sie vorkommen, weiß man nicht ohne Zusammenhang, welches gemeint ist.

Quote
In Textdateien gibt es keine Dateikennungen wie in anderen Dateien.

Genau.
Immerhin habe ich den Eindruck, dass sich Unicode gegen die alten ISO-Kodierungen etwas schneller durchsetzt als IPv6 gegen IPv4...\n\n

<!--EDIT|Dubu|1150141043-->

View full thread Datei kein UTF8