Thread Parsen dauert ewig lange mit XML::LibXML (11 answers)
Opened by BratHering at 2009-12-25 23:57

BratHering
 2009-12-25 23:57
#129699 #129699
User since
2005-04-28
155 Artikel
BenutzerIn
[default_avatar]
Hallo,

es sollte ein einfaches Unterfangen sein ein XHTML-Dokument zu parsen, jedoch bin ich auf ein mir unerklärliches Verhalten von XML::LibXML gestoßen.

Also ich benutze das o.g. Modul, um ein 4KB großes XHTML-Dokument mittels der Methode parse_file in ein DOM einzulesen. Das dauert ca. 10 Sekunden. Verwende ich aber stattdessen die Methode parse_html_file so ist die Zeit nicht mehr zu messen, so schnell geht das. Und das Ergebnis, nämlich das DOM, ist das gleiche.

Doch warum diese zeitliche Differenz? Kann mir das jemand bitte erklären? - Oder habe ich etwas grundsätzlichen an XML nicht verstanden? Danke schon mal.

Dies ist mein Code:
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
use strict;
use XML::LibXML;

my $pathToFile = "/path/to/file";
my $parser = new XML::LibXML;

# Folgender Code ist das problem
my $dom = $parser->parse_file($pathToFile);
# bzw.
my $dom = $parser->parse_html_file($pathToFile);
# Nur eine von beiden verwenden!


Gruß
Brathering

View full thread Parsen dauert ewig lange mit XML::LibXML