Thread Grundlegende Frage zu Regulären Ausdrücken (HTML ausfiltern)
(23 answers)
Opened by Roper at 2008-06-28 18:21 Roper+2008-06-29 00:28:39-- Jaja, dieses Stadium haben wahrscheinleich alle mal durchgemacht ;-) Normales HTML ist schon schwierig genug zu parsen ;-) Wenn Du meinst, dass in Deiner Datei die spitzen Klammern ausschließlich für das Kennzeichnen von HTML-Tags dienen und innerhalb der < > auch nur Wegwerfinformation steht, dann geht es natürlich mit RegEx (vgl. esskar): Das '?' hinter dem Quantifier '*' bewirkt, dass nur bis zum ersten '>' gesucht wird, sonst wird nämlich alles vom ersten '<' bis zum letzten '>' gematcht ('gieriges' Verhalten). Der Modifier 'g' (global) führt zum Ersetzen aller Tags in $line, ansonsten wird nur der erste Treffer entfernt. Schau Dir mal perlrequick und perlretut an ... Everyone knows that debugging is twice as hard as writing a program in the first place. So if you're as clever as you can be when you write it, how will you ever debug it? -- Brian Kernighan: "The Elements of Programming Style"
|