Thread RE recursion (24 answers)
Opened by linuxCowboy at 2014-04-15 20:19

Raubtier
 2014-04-16 08:31
#174806 #174806
User since
2012-05-04
1054 Artikel
BenutzerIn

user image
2014-04-15T21:47:11 linuxCowboy
Danke.

Ich habe die faq gelesen: XML::Parser und HTML::Parser.

Aber auch pcrepattern. Wenn auch - offensichtlich - nicht alles verstanden ;-)

Dort gibt es z.B. das Feature "RECURSIVE PATTERNS".

So ein Modul heißt doch eigentlich auch nur, daß jemand, der die Sache verstanden hat, das dann implementiert hat.

Nein, das heißt es nicht. HTML-Parser gab es außerdem schon, bevor rekursive Patterns in Perl implementiert wurden.

Was machst du außerdem, wenn jemand noch irgendwo ein <!-- und --> eingebaut hat? Man kommt zwar mit REs sehr schnell zum Ziel, wenn man das genaue HTML kennt, aber die Parser sind allgemein.

Allerdings frage ich mich bei deinem Ausgangsstring
<div ...><div ...</div>Text<div ..</div>..</div>Text, ob der wirklich so aussieht. Also zum Beispiel ein fehlendes > beim 2. div. Oder soll das in den .. enthalten sein? Wenn es nämlich ungültiges HTML ist, kannst du mit Parsern Probleme bekommen.

View full thread RE recursion