Thread Regex für Spamfilter bei Nicht-Ascii
(33 answers)
Opened by GwenDragon at 2012-06-17 18:27
\b ist ja eigentlich als (?:(?<!\w)(?=\w)|(?<=\w)(?!\w)) definiert wie merlyn (Randal L. Schwartz) in
![]() \w ist aber meines Erachtens eben locale abhängig. Oder sehe ich das falsch? Wenn ich keine Abhängigkeit zu locale will, müsste ich \w als Zeichenklasse neu definieren. Ich habe gerade keine Idee, wie das für UTF geschehen soll. |