Thread Unicode (25 answers)
Opened by ptk at 2007-08-12 20:38

sid burn
 2007-08-13 14:52
#98044 #98044
User since
2006-03-29
1520 Artikel
BenutzerIn

user image
Quote
Nein. Kommt darauf an, was als Fallback eingestellt ist.
Es ist nur so, dass manche Browser bei Zeichen, die nicht im Zeichensatz drin sind, das UTF-8-Pendant senden.

Diese Info hatte ich hierher:
http://www.linux-magazin.de/heft_abo/ausgaben/2007...
Quote
Übrigens verwenden die meisten gegenwärtig Dienst tuenden Webbrowser nicht den ISO-8859-1-Standard zur Dekodierung, selbst wenn es der Webserver verlangt. Stattdessen arbeiten sie nach dem Windows-1252-Standard, der noch einige zusätzliche Zeichen und wie ISO-8859-15 das Eurozeichen definiert.


Ähm, ansonsten wenn du auf iso-8859-1 etc. arbeitest dann kennt er keine Definition von Zeichen. Es kommen bytes an. Wie diese Bytes dargestellt werden hängt davon ab welchen zeichensatz du nutzt.

Wenn das Byte mit der dezimalen darstellung "164" ankommt, und es ist iso-8859-15 als zeichensatz eingestellt dann zeigt er ein Euro Zeichen an. Stellst du iso-8859-1 ein, siehst du ein anderes zeichen. Der Webbrowser hat keine Ahnung davon was das für ein zeichen sein soll. Und er kann auch nicht Wissen ob nun damit ein € zeichen oder ein anderes zeichen aus dem Arabischen, Hybräischen oder sonstwas Zeichensatz gemeint war.


Mit UTF-8 ist es etwas anders. Wenn eine Zeichenkodierung wofür er im aktuellen Schriftsatz kein Zeichen dafür hat, dann holt er sich das zeichen meist aus einer anderen Schriftart auf dem System. Wenn das auch nicht vorhanden ist, dann zeigt der browser meist eckicge Blöcke an, und wenn man genau hinschaut steht dort die Unicode Nummer für das zeichen drin.
Nicht mehr aktiv. Bei Kontakt: ICQ: 404181669 E-Mail: perl@david-raab.de

View full thread Unicode