Thread Regex <br /> hinter <li> entfernen (6 answers)
Opened by Gast at 2008-10-15 22:18

Linuxer
 2008-10-15 23:40
#115550 #115550
User since
2006-01-27
3875 Artikel
HausmeisterIn

user image
Wenn Du mit den Fehlern leben willst, die das Parsen von HTML mit Regex mit sich bringen kann (bzw. mit sich bringt), kannst Du folgenden Regex versuchen:

Code (perl): (dl )
$text =~ s{(?:<br\s+/>)?(\s*</?(?:[uo]l|li)>\s*)(?:<br\s+/>)?}{$1}gi;


Anpassungen für enthaltene Attribute oder Verwendung des Punkt als Platzhalter bitte selber vornehmen!

Wenn Du es sauber lösen willst, solltest Du Dir ein Parser-Modul anschauen, z.B. CPAN:HTML::Parser.
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!

View full thread Regex <br /> hinter <li> entfernen