Thread HTML::Parser - Handler Issue [Anfänger] (2 answers)
Opened by Tiefkuehlpizza at 2013-05-22 15:03

clms
 2013-05-22 15:56
#167735 #167735
User since
2010-08-29
373 Artikel
BenutzerIn
[default_avatar]
Zum konkreten Problem kann ich nichts zu pqs Antwort hinzufügen.

Ich habe mich seit Jahren nicht mehr mit CPAN:HTML::Parser selbst beschäftigt. Für meine konkreten Anwedungen verwende ichCPAN:HTML::TreeBuilder oder CPAN:HTML::LinkExtor. (Beide erben von CPAN:HTML::Parser)

2013-05-22T13:03:17 Tiefkuehlpizza
Im Endeffekt möchte ich den Inhalt verschiedener Tags in ein Array schreiben. Wenn ein besserer Ansatz existiert, immer her damit.


Das ist ein bischen zu unpräzise. Ich habe noch eine konkrete Idee, was Du genau machen willst. Evtl. sind die oben genannten Module ja das richtige für Dich.

Außerdem ist die Frage wie man "besser" definiert. Wenn ich die Aufgabe bekäme, z.B. alle "H1" bis "H6"-Überschriften aus einem HTML-File zu extrahieren, würde ich das höchstwahrscheinlich mit CPAN:HTML::TreeBuilder angehen, weil ich dann schneller eine lauffähige Lösung habe, obwohl eine Lösung mit "purem" CPAN:HTML::Parser sicher weniger CPU-Zeit benötigen würde.

View full thread HTML::Parser - Handler Issue [Anfänger]