Schrift
[thread]6660[/thread]

reguläre Ausdrücke



<< >> 7 Einträge, 1 Seite
autopsie
 2005-01-24 22:39
#51250 #51250
User since
2005-01-20
4 Artikel
BenutzerIn
[default_avatar]
Hi Leute,
erstmal danke für eure Hilfe bei meinem Problem mit spliten. Diesmal möchte ich fragen, ob mir jemand mit einem regulären Ausdruck helfen kann. Dieser soll mir aus einer Textdatei alle Wörter, die mit Klein- und Großbuchstaben anfangen, aber keine Sonderzeichen, wie ,.:"" herausgeben. Um Klein-Großsreibung geht eigentlich nicht, soweit bin ich schon. Wie soll ich es aber alles so in einem regulären Ausdruck verbinden, dass die blüden Sonderzeichen auch verschwinden?
esskar
 2005-01-24 22:48
#51251 #51251
User since
2003-08-04
7321 Artikel
ModeratorIn

user image
zeig uns doch einfach mal was du schon hast!
lichtkind
 2005-01-24 22:54
#51252 #51252
User since
2004-03-22
5680 Artikel
ModeratorIn + EditorIn
[Homepage]
user image
nur sonderzeichen verschwinden oder auch wörter in denen sie vorkommen wenn es nur bestimmt zeichen sind dnn bild eine klasse und filter sie weg
Wiki:Tutorien in der Wiki, mein zeug:
kephra, baumhaus, garten, gezwitscher

Es beginnt immer mit einer Entscheidung.
pq
 2005-01-25 00:46
#51253 #51253
User since
2003-08-04
12208 Artikel
Admin1
[Homepage]
user image
perl -pi.bak -e 's/[\W_]+//g' datei
(ungetestet)
Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
lesen: Wiki:Wie frage ich & perlintro Wiki:brian's Leitfaden für jedes Perl-Problem
autopsie
 2005-01-26 10:50
#51254 #51254
User since
2005-01-20
4 Artikel
BenutzerIn
[default_avatar]
Hi Leute,
danke für eure Interesse, ich hab schon geschaft. Habe mit
split /[\^,.""* ]/ alle Sonderzeichen entfernt und das Leerzeichen nach dem Stern hat mir die Wörter, jedes in einer Zeile, ausgegeben.
Trotzdem nochmal danke.......
Dubu
 2005-01-26 14:01
#51255 #51255
User since
2003-08-04
2145 Artikel
ModeratorIn + EditorIn

user image
Was ist mit Doppelpunkt? Was ist mit Semikolon? Klammern? Ziffern? Was ist mit mehreren Sonderzeichen hintereinander (das gibt bei dir wahrscheinlich mehrere "leere" Woerter)?

Du siehst, es ist einfacher anzugeben "nimm alles, was kein Wortzeichen ist" als "nimm dies nicht und das nicht und das andere auch nicht und, und, und ...".

Wie pq schon meinte, hier mit split und ohne Ziffern:
Code: (dl )
split /[\W_0-9]+/

oder, wenn Umlaute etc. zu den Wortzeichen zaehlen sollen:
Code: (dl )
1
2
use locale;
split /[^[:alpha:]]/
autopsie
 2005-01-26 19:12
#51256 #51256
User since
2005-01-20
4 Artikel
BenutzerIn
[default_avatar]
Gut zu wissen, danke. In meinem Fall habe ich nur diese bestimmten sonderzeichen entfernen mussen.\n\n

<!--EDIT|autopsie|1106759625-->
<< >> 7 Einträge, 1 Seite



View all threads created 2005-01-24 22:39.