Thread Regex für Spamfilter bei Nicht-Ascii (33 answers)
Opened by GwenDragon at 2012-06-17 18:27

GwenDragon
 2013-05-24 09:28
#167781 #167781
User since
2005-01-17
14848 Artikel
Admin1
[Homepage]
user image
\b ist ja eigentlich als (?:(?<!\w)(?=\w)|(?<=\w)(?!\w)) definiert wie merlyn (Randal L. Schwartz) in Perlmonks:297712 schreibt.

\w ist aber meines Erachtens eben locale abhängig. Oder sehe ich das falsch?

Wenn ich keine Abhängigkeit zu locale will, müsste ich \w als Zeichenklasse neu definieren.
Ich habe gerade keine Idee, wie das für UTF geschehen soll.

View full thread Regex für Spamfilter bei Nicht-Ascii