Hallo Freunde,
mit Mojo extrahiere ich Content von diversen Webseiten.
Nun habe ich folgendes Problem! Auf einer Webseite ist der Content folgendermaßen angeordnet.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
<table>
<tbody>
<tr>
<td>
<div>
Alter:
<br>
Wohnort:
<br>
Haarfarbe:
<br>
Figur:
<br>
Gewicht:
<br>
</div>
</td>
<td>
<div>
28 Jahre
<br>
Berlin
<br>
blond
<br>
schlank
<br>
54 kg
<br>
</div>
</td>
</tr>
</tbody>
</table>
Wie ihr hier seht, sind die Informationen (die eigentlich zusammengehören) auf zwei td-Bereiche aufgesplittet.
Ich habe hierbei nun Schwierigekeiten die Zeilen des ersten td-Bereiches mit den Zeilen des zweiten td-Bereiches zusammenzuführen - ich müsste Sie (irgendwie) mappen um den Content zusammnführen zu können.
Das Ergebnis müsste folgendermaßen aussehen:
Alter: 28 Jahre
Wohnort: Berlin
Haarfarbe: blond
Figur: schlank
Bisher arbeitete ich mit Mojo aber ich finde hierzu keine Lösung (auch weil ich noch Anfänger bin).
Hat von vielleicht jemand eine Idee wie man die beiden td-Bereichen zusammenführen/mappen kann um sie weiterverarbeiten zu können?
Vielen Dank schonmal
Gruß Matthias
Last edited: 2014-10-02 13:19:36 +0200 (CEST)