Thread Regex für Spamfilter bei Nicht-Ascii (33 answers)
Opened by GwenDragon at 2012-06-17 18:27

Linuxer
 2013-06-17 22:12
#168389 #168389
User since
2006-01-27
3891 Artikel
HausmeisterIn

user image
Hi,

also bei mir funktioniert der Test sobald ich das use locale weglasse.
Auch das gesamte POSIX-Zeug kann raus:

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
$ perl -v | grep version
This is perl 5, version 16, subversion 0 (v5.16.0) built for x86_64-linux
$ locale | grep LC_CTYPE
LC_CTYPE="en_GB.UTF-8"
$ perl -w -E "use locale; use POSIX qw(locale_h); setlocale(LC_CTYPE,'de_DE.utf-8'); say 'betätigt' ~~ /bet\b/"
1
$ perl -w -E "use POSIX qw(locale_h); setlocale(LC_CTYPE,'de_DE.utf-8'); say 'betätigt' ~~ /bet\b/"

$ perl -w -E "say 'betätigt' ~~ /bet\b/"

$


edit: erklären kann ich's nicht ;-)
Last edited: 2013-06-17 22:14:01 +0200 (CEST)
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!

View full thread Regex für Spamfilter bei Nicht-Ascii