Schrift
[thread]7762[/thread]

spam erkennen regex (Seite 2)



<< |< 1 2 3 >| >> 21 Einträge, 3 Seiten
ptk
 2006-03-07 00:59
#63476 #63476
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
Lustigerweise matcht diese Regexp dein allererstes Beispiel in diesem Thread.

Wie wäre es mit einem Wörterbuchvergleich? Aber dann haben Leute mit schwacher Rechtschreibung das Nachsehen. Vielleicht zusätzlich zum Wörterbuch mit approximativem Matching?

Am besten ist es wohl, wenn du einen billigen Studenten einstellst, der alle eingegebenen Texte überprüft.
Froschpopo
 2006-03-07 01:04
#63477 #63477
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
ich glaube ihr versteht hier alle etwas falsch: ich möchte nicht die rechtschreibung verhindern! Man soll ruhig so schreiben dürfen, wie man spricht (Chatter-Slang).
Es ist nur folgender Sachverhalt: In meine Community bekommt man erst Einlass, wenn man sein profil ausgefüllt hat. Ich achte dabei auf ein besonderes Niveau. Einige versuchen sich jedoch den Zutritt zu erschleichen, indem sie die 120 vorgeschriebenen Buchstaben einfach durch "siahzdaiusfdgtoa7iwzetfioaw7eugfiwauekgfiowuaegfiauwfegiowauegfiueagsf" erreichen.
Eigentlich möchte ich nur sowas verhindern.
ptk
 2006-03-07 01:10
#63478 #63478
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
Nein, ich verstehe dich sehr gut. Du möchtest Künstliche Intelligenz mit Regexps implementieren. Und das geht nicht.
Froschpopo
 2006-03-07 01:14
#63479 #63479
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
du verstehst mich kein bisschen ! Ich will einfach nur die betrügereien etwas mindern.
Mein regex oben macht auch schon den Anfang.

mein regex soll einfach einen String auf einige ganz billige Kriterien überprüfen. Was hat das mit KI zu tun?\n\n

<!--EDIT|Froschpopo|1141686890-->
ptk
 2006-03-07 01:20
#63480 #63480
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
OK, wenn's ganz billig sein soll: deine Regexp solltest du statt auf max=50 auf vielleicht max=20 oder so reduzieren (alle deine Beispiele haben kaum Spaces im Text, außerdem werden deutsche Wörter kaum länger). Vielleicht solltest du auch Umlaute erlauben. Zahlen gemischt mit Buchstaben sollten doch nicht vorkommen, oder?
Froschpopo
 2006-03-07 01:30
#63481 #63481
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
DAS ist ein hilfreicher Tipp! Das bringt mich viel weiter.

Also wie sieht das aus:
doppelte sachen durch einheitliches ersetzen: s/(\w+) \1)/$1/
den kack mit den umlauten mach ich mit
Code: (dl )
1
2
3
4
use POSIX;
use locale;
setlocale(LC_CTYPE,
"de_DE.ISO-8859-1");
Dubu
 2006-03-07 01:39
#63482 #63482
User since
2003-08-04
2145 Artikel
ModeratorIn + EditorIn

user image
Wenn dein Forum dank der komischen Regex jammert, würde ich einfach sowas hineinschreiben: "As gadsfg afg asrg asdf afdsg Afgs ysfg ysfdg ethz Hedf hydfh aer Zae ghadf Gadfg ydsfg dadgh adf gh". So, jetzt versuch mal zu erkennen, dass das Unsinn ist - ohne wörterbuchbasierte Analyse. ;)
Froschpopo
 2006-03-07 01:42
#63483 #63483
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
darauf kommen nur gaanz wenige weibliche User und ich hab in meiner community fast nur sowelche :) Außerdem setze ich sie mit 5 maximalversuchen unter druck, dann klappt das schon :) Und sie erfahren auch nicht konkret woran es liegt, nur dass sie sich etwas mehr anstrengen und einen vernünftigen text schreiben sollen.Und wenn ein Mädel halt die 5 maximalversuche überschreitet, wird z.B. zur Strafe die Mailbox für 5 Tage gesperrt... so muss man das machen, von mir könnt ihr einiges lernen!\n\n

<!--EDIT|Froschpopo|1141688594-->
FC
 2006-03-07 05:43
#63484 #63484
User since
2005-01-25
8 Artikel
BenutzerIn
[default_avatar]
ptk hat schon Recht, was die Sache mit der "KI" angeht ;)

Das Pboerlm ist, dass wir Srphace nihct Bhatcusbe für Bhtbusace whmrenehan, snerdon als enie Albfoge von Mesturn, die wir gneelrt hbean. Und dafür sind Cemtoupr lieedr zu dämclih, wiel sie ltclzteih nur Zeheicn meinaditner vecrghelein können.

Wenn Du das aber gut und zuverlässig auf die Reihe bekommst, freue ich mich auf den ersten *wirklich* funktionierenden Spam-Filter aus dem Hause "Froschpopo" :)
Froschpopo
 2006-03-07 06:46
#63485 #63485
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
was du da geschrieben hast ist schon inordnung, da es wenigstens keinen zeilenumbruch erzeugt! Das ist eines meiner hauptkriterien! Ich lese sowieso alle einträge durch... das was ptk da beschwört war nie Thema des Threads, ich weiss auch nicht wer hier den Anstoss eines Rechtschreibprogramms gebracht hat...
<< |< 1 2 3 >| >> 21 Einträge, 3 Seiten



View all threads created 2006-03-05 18:40.