Schrift
[thread]12338[/thread]

Umlaute werden fälschlicherweise in UTF8 umgewandelt (Seite 2)

Tags: Ähnliche Threads

Leser: 4


<< |< 1 2 3 >| >> 27 Einträge, 3 Seiten
GwenDragon
 2008-08-11 14:15
#113339 #113339
User since
2005-01-17
14548 Artikel
Admin1
[Homepage]
user image
Übrigens, ab Perl 5.6 wandelt HTML::Entities standardmässig in UTF-8 um.

Du kannst natürlich auch bei Perl 5.8 die Ausgabekodierung bei den Textdateien umstellen.

Siehe PerlIO und perluniintro
Siehe http://perldoc.perl.org/perluniintro.html#Unicode-...

Du könntest über eine if-Abfrage der Perlversion eine anders open einsetzen.
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

marky
 2008-08-11 14:20
#113341 #113341
User since
2003-08-15
215 Artikel
BenutzerIn
[Homepage] [default_avatar]
Ich habe das einfach nicht bemerkt, weil immer mein 5.6 Modul gezogen wurde.

Gib es denn eine Möglichkeit, dass immer nur latin-1 umgewandelt wird bzw. wie kann man da vorgehen? Damit das auch eine Zukunft hat.

Die Eingabe in dem Fall kommt über einen wysiwyg-Editor und ich will in der Textdatei halt die echten Zeichen haben, wobei die Latin1 reichen, es geht dabei eigentlich nur darum, dass die bei der Suche erkannt werden.
marky
 2008-08-11 14:22
#113342 #113342
User since
2003-08-15
215 Artikel
BenutzerIn
[Homepage] [default_avatar]
Was ich allerdings seltsam finde, ist dass die ganze Zeile als utf8 gespeichert wird, obwohl ich nur einen Teil damit konvertiert habe.
Struppi
 2008-08-11 14:27
#113344 #113344
User since
2006-02-17
628 Artikel
BenutzerIn
[Homepage]
user image
Wieso musst du den umwandeln?
Wenn deine Seite in ISO dargestellt wird, werden die Zeichen auch so übertragen. Kann es sein, dass der WYSIWYG Editor die Zeichen umwandelt?
marky
 2008-08-11 14:29
#113345 #113345
User since
2003-08-15
215 Artikel
BenutzerIn
[Homepage] [default_avatar]
Der Editor (htmlarea) schickt, zb. &auml; das wäre vom Prinzip kein Problem, dann müsste ich aber bei der Suche jedesmal umwandeln, wenn jemand nach ä sucht, daher will ich, dass ich der DB ein ä und nicht &auml; steht. Und dazu wandle ich die EIngabe des Editor halt um.
Struppi
 2008-08-11 15:02
#113346 #113346
User since
2006-02-17
628 Artikel
BenutzerIn
[Homepage]
user image
Ich benutzte ebenfalls htmlarea, die sendet mir zumindest normale Umlaute
GwenDragon
 2008-08-11 15:22
#113347 #113347
User since
2005-01-17
14548 Artikel
Admin1
[Homepage]
user image
HTMLArea wird aber nicht mehr weiter entwickelt.
Ich werde mal die letzte Version (3.0-25.10.2007) lokal testen.

HTMLArea sendet nichts umkodiert an ein CGI.
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

GwenDragon
 2008-08-11 16:21
#113350 #113350
User since
2005-01-17
14548 Artikel
Admin1
[Homepage]
user image
Nimm halt solchen Code:

Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
# $data sind die Daten, welche vom Browser gesendet werden
HTML::Entities::decode($data);

# Version abfragen
if ($^V < 5.008) { # älter als Perl 5.8
  open(my $dbase, ">", "mydbase.txt")) or die($!);
}
if ($^V >= 5.008) { # neuer oder Perl 5.8
  open(my $dbase, ">:encoding(iso-8859-1)", "mydbase.txt")) or die($!);
}



Dann kommt sowas dabei heraus wenn es Perl >= 5.8 ist und ich aus der Zeichentabelle Unicodes und nationale Sonderzeichen eintrage:
Code: (dl )
1
2
3
4
5
6
7
8
\x{fd9c}\x{fd74} Arabisch
\x{fa02}\x{f9ed}\x{fa04} Japanisch
äöüß\x{20ac} Deutsch
éèçFranzösisch
\x{043b}\x{0440}\x{0428} Kyrillisch
\x{0993}\x{0989}\x{09a5} bengali
\x{22d9}\x{22ad}\x{229c}\x{2467} Zeichen
\x{fb26}\x{fb2b}\x{fb3e}\x{fb24}\x{05e9} Hebräisch


Das hat halt den Vorteil, dass Unicodezeichen erhalten bleiben.
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

marky
 2008-08-11 16:37
#113352 #113352
User since
2003-08-15
215 Artikel
BenutzerIn
[Homepage] [default_avatar]
Hallo,

wir sind doch nicht bei PHP - ich bin gerade froh an Perl, dass ich da eigentlich nicht auf die Version achten muss :-) und es wären viele 100 Einträge, das wäre keine Alternative.

Mit dem 5.6 Modul geht es ja ohne Probleme - da sind auch keine Verzweigungen drin, ich nenne das einfach anders, dann gibt es keine Konflikte.

Das HTMLArea nicht mehr weiterentwickelt wird, habe ich noch gar nicht bemkert, ich habe seinerzeit alle üblichen verdächtigen getestet und fande den am besten, dann werde ich mir mal wieder tinymce anschauen - denn fand ich damals noch nicht ganz so gut.
GwenDragon
 2008-08-11 16:49
#113353 #113353
User since
2005-01-17
14548 Artikel
Admin1
[Homepage]
user image
Quote
ich habe seinerzeit alle üblichen verdächtigen getestet und fande den am besten,
HTMLArea läuft nicht mit neueren Browsern, deswegen solltst du schon wechseln.

Quote
wir sind doch nicht bei PHP - ich bin gerade froh an Perl, dass ich da eigentlich nicht auf die Version achten muss
Ach, nein?
Wenn du die Unterschiede kennen würdest, wärst du wohl kaum in die UTF-Falle getappt.

Versionsabfragen gibt es in Perlskripten und -Modulen. Du solltest da mal in den Quellcode schauen.

Was soll&#8217;s. Dann verwende eben veraltete Module. Mir ist es egal.
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

<< |< 1 2 3 >| >> 27 Einträge, 3 Seiten



View all threads created 2008-08-11 13:24.