Thread XPath (1 answers)
Opened by Bob at 2011-05-22 21:55

Bob
 2011-05-22 21:55
#149013 #149013
User since
2011-05-21
6 Artikel
BenutzerIn
[default_avatar]
Hallo allerseits!

Ich sitze hier immer noch an meinem Vorhaben, die Text-Inhalte von HTML-Seiten zu parsen (XPath). Dabei hat mir diese Seite schon die meisten Fragen beantwortet. Was ich noch nicht kapiert habe, ist Folgendes:

Code: (dl )
1
2
3
4
5
6
<div id="Text">
Dies ist Satz 1.
<p>Dies ist Satz 2.</p>
Dies ist Satz 3.
<div id="Box">Satz 4 gehört nicht zum Text.</div>
</div>


Wie schaffe ich es KORREKTERWEISE, sowohl die Sätze 1 und 3 als auch Satz 2 zu erfassen, aber bspw. nicht Satz 4. In der Praxis scheint zwar

Code: (dl )
//div[@id="Text"]/p


für alle drei Sätze zu funktionieren. Aber sollte es das auch? Bzw. wie käme ich nur an die Sätze 1 und 3 heran? Ich hätte jetzt Folgendes gesagt, aber das funktioniert nicht:

Code: (dl )
//div[@id="Text"]/text()


Es dankt einmal mehr

Bob

View full thread XPath