Schrift
[thread]7768[/thread]

wörter prüfen

Leser: 1


<< >> 5 Einträge, 1 Seite
Froschpopo
 2006-03-07 02:01
#63564 #63564
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
hab hier folgenden regex gebastelt:
Code: (dl )
/\b(((.)\1\1)+{2,50})\b/


geprüft wird folgender string:

"hallo uschhhhhhi" # soll wahr ergeben, da mehr als 3 "h" hintereinander.

möchte also die einzelnen wörter auf mehrere unmittelbar aufeinander folgende zeichen kontrollieren.

"hallo uschhhhhi" wäre dann also true.

"hallo uschi" wäre false.

jemand ne idee wie der regex funktional aussähe?
FC
 2006-03-07 05:56
#63565 #63565
User since
2005-01-25
8 Artikel
BenutzerIn
[default_avatar]
Darf ich deine geschätzte Aufmerksamkeit mal auf diese Datei lenken ? :-)

http://slabihoud.de/spampal/filters.dat

Das sind so etwa 1000 Regexe, die nix anderes wollen, als zumindest mit einer gewissen Wahrscheinlichkeit spam zu filtern.
Da findest Du sicher einige Anregungen.
Froschpopo
 2006-03-07 06:50
#63566 #63566
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
ähm, es geht um Textspam wie z.b. "jashdiaksgdiasgdisazgzsdai" !
ich betreibe einen Chat, der blöderweise einen zeilenumbruch generiert, den der IE trotz css-maßnahmen leider ignoriert.

Der obige Regex beschäftigt sich hingegen mit etwas ganz anderem. er soll verhindern, dass in einem Wort, kein Zeichen mehr als 3 mal unmittelbar in Folge erscheint. Das ist weder ein SPAM-Schutz gegen Vicodin, E-mail adressen, sondern vielmehr eine Schönheitskorrektur.
Code: (dl )
Schönheitskorrektur != SPAMfilter


Ich danke dir aber trotzdem für die url, die zwar total ot ist, mich aber dennoch sehr interessiert!\n\n

<!--EDIT|Froschpopo|1141707105-->
renee
 2006-03-07 09:10
#63567 #63567
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
mit 3 mal in unmittelbarer Folge schliesst Du Worte wie "Fussballlehrer", "Schlossstrasse" und viele andere aus, die sicher alles andere als "Spam" sind...

Drei gleiche Zeichen hintereinander kann man mit /(.)\1\1/ matchen...

Edit: Gedankenfehler...\n\n

<!--EDIT|renee|1141716144-->
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
Relais
 2006-03-07 12:39
#63568 #63568
User since
2003-08-06
2244 Artikel
ModeratorIn
[Homepage] [default_avatar]
Das heißt, hier ist der Fehler im Design, Du müßtest nach mindestens 4 aufeinanderfolgenden Buchstaben matchen.

Texte wie:
"warte mal, ich überlege gerade noch ...... da war was, ich such es Dir gleich raus, bin gleich wieder da ......."
oder:
"lange nicht gesehen!!!!!!!!!"
"was meinst Du damit nur wieder????????"
"also:
2,50
+3,60
-------
=6,10!"
oder
"in Binary ist das dann 101111101."
...entsprechen durchaus meiner Chat-erfahrung, Du solltest daher nicht jegliche Zeichen in Häufung ausschliessen, sondern eher nur die meisten. Und es dokumentieren, damit brave Chatter einen Workaraound haben wie:
"Die Firma heisst wohl wegen der Telefonbuch-Sortierung tatsächlich ,,AAA AAAllround GmbH'' ohne das Leerzeichen, das ist nur da um dem Spamfilter gerade zu umgehen."
Erst denken, dann posten --
26. Deutscher Perl- u. Raku -Workshop 15. bis 17.04.2024 in Frankfurt/M.

Winter is Coming
<< >> 5 Einträge, 1 Seite



View all threads created 2006-03-07 02:01.