Thread Hilfe bei Regulären Ausdrücken (Regex) (6 answers)
Opened by Student82 at 2010-09-04 18:10

BernhardSchmalhofer
 2010-09-05 11:25
#141179 #141179
User since
2009-03-26
56 Artikel
BenutzerIn
[Homepage] [default_avatar]
Schlampig ausgedrückt ist
Code (perl): (dl )
\W*(\w+\W+){1,2}\w+\W*
eine Bedingung das 'WerBinIch' aus zwei oder drei Wörtern bestehen muss.

Ein Wort besteht aus einer Serie von Word-Zeichen. Laut
XML Schema 2.0
ist ein Word-Zeichen:

Quote
(all characters except the set of "punctuation", "separator" and "other" characters)


Getrennt sind die die Wörter durch ein oder mehr nicht-Wort-Zeichen, also durch 'Punktierung', 'Seperator' und 'Andere'.

Am Anfang und am Ende des Strings dürfen nicht-Word-Codepoints auftauchen.

Falls der reguläre Ausdruch eine Bedingung für Personennamen sein soll, dann ist er seh fragwürdig. Zum Beispiel würde 'Karl-Heinz Friedrich Dettenhofer' zurückgewiesen, da der Bindestrich, '-' U+2010, eine Punktuation ist und der String somit aus vier Wörten besteht.

View full thread Hilfe bei Regulären Ausdrücken (Regex)