Thread regex und UTF-8: Abfrage die auch Umlaute erkennt (3 answers)
Opened by decoder at 2006-05-28 16:49

decoder
 2006-05-28 16:49
#66653 #66653
User since
2006-03-30
22 Artikel
BenutzerIn
[default_avatar]
hi,

Ich habe ein perl-script das in UTF-8 gespeichert ist.

es soll ein 2-stelliger String ($a kommt von CGI) kontrolliert werden ob nur Buchstaben drinnen vorkommen genau so wie man das mit \w macht.
Mit \w geht das aber leider nicht weil er zb; ö, ä, ü, ß, .. nicht als Buchstaben erkennt.

Im moment arbeite ich mit dieser Lösung (unten):
Ich wandle den zu ürberprüfenden String von UTF-8 in ISO um.

Ich kann mir nicht vorstellen das es da nichts besseres gibt :)

Bitte um eure Hilfe, dankend bernd.

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
my $cgi = CGI->new();
my $a = $cgi->param('a');
print $cgi->header('text/html; charset=utf-8');

use Encode;
my $a_iso = $a;
Encode::from_to($a_iso, 'utf8','iso-8859-1');

if ($a_iso =~ /^\p{L}\p{L}$/g)
{
print "ok"; # funktioniert mit umlauten..
}

View full thread regex und UTF-8: Abfrage die auch Umlaute erkennt