Thread regex: Strings nach Spam filtern: Spamfilter selbstgemacht (13 answers)
Opened by Froschpopo at 2003-09-12 16:30

Froschpopo
 2003-09-12 16:30
#51449 #51449
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
Ich bin Betreiber einer relativ großen Partnerbörse im Internet.
Nun habe ich das Problem, dass viele Leute ihr Profil unnötig lang strecken indem Sie Buchstaben häufig wiederholen.

Ein paar Beispiele:

Beispiel 1.
Code: (dl )
hallo, was geht ab (der rest besteht aus leerzeichen die nur den Zweck erfüllen die vorgeschriebene min. Länge von 120 Zeichen zu erreichen.)

Beispiel 2.
Code: (dl )
bla bla bla bla bla bla bla...

Beispiel 3.
Code: (dl )
oooooooooooooooooooooooooooooooo...

Beispiel 4.
Code: (dl )
as80ash0dhas0ahsdhoshdoihoihoihoiashd0asdha0sdhas0dh

solche Arten von Spam möchte natürlich gerne verhindern. Vielleicht könnt Ihr mich ein bissl beraten, bei der Suche nach Funktionen um solche SPammer zu bekämpfen.

für letzteres (beispiel 4.) verwende ich jetzt folgendes Muster:
Code: (dl )
s/(\S{68})(?!.*?>)/$1<BR>/g;

das stellt mich vorerst zufrieden, aber das ist nur ein kleiner Anfang gewesen (beachte auch die anderen Beispiele).

Gruß

View full thread regex: Strings nach Spam filtern: Spamfilter selbstgemacht