Schrift
[thread]1058[/thread]

Tabellen aus HTML (einzeln) in HTML schreiben

Leser: 2


<< >> 6 Einträge, 1 Seite
Gast Gast
 2006-07-24 15:39
#10739 #10739
Hallo!

Ich habe folgendes Problem: Ich habe ein HTML-Dokument. Aus diesem -- genauer: den Tabellen -- soll ich Werte extrahieren.

Mein HTML-Dokument sieht wie folgt aus:

Code: (dl )
1
2
3
4
5
6
7
8
9
10
ÜBERSCHRIFT 

[Tabelle1]
[Tabelle2]
[Beschriftung1 | Wert1 | Wert2 | Wert3]
[Beschriftung2 | Wert4 | Wert5 | Wert6]

[Tabelle3]
[Tabelle4]
...


Ich stelle mir das so vor, dass ich das gesamte Dokument in mehrere kleine zerlege. Also, dass ich mir mit Hilfe eines TableParsers (?) die Tabellen 1 (inkl. 2), 3, ... usw. in neue HTML-Dateien schreiben lassen.

Wenn das gesehen ist, möchte ich in den Teildateien explizit nach Mustern suchen (mit Regulären Ausdrücken) ... damit ich nicht immer über das ganze Dokument suchen muss.

Hat jemand einen Ansatz? Bisher durchsuche ich das ganze HTML-Dokument mit Regulären Ausdrücken ... und das immer wieder. Obwohl ich z. B. manchmal nur Werte aus der 1. Tabelle brauche und ich somit nicht alle anderen durchsuchen müsste.
GwenDragon
 2006-07-24 16:28
#10740 #10740
User since
2005-01-17
14533 Artikel
Admin1
[Homepage]
user image
Mit CPAN:HTML::Parser kanns du die Tabellen extrahieren und auch die Zeilen und Spalten.
Reguläre Ausdrücke zum Parsen des HTML funktionieren nicht immer richtig.

Zudem gibt es noch ;)
CPAN:HTML-TableParser CPAN:HTML-TableExtract\n\n

<!--EDIT|GwenDragon|1153744210-->
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

renee
 2006-07-24 17:03
#10741 #10741
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
Vielleicht hilft Dir CPAN:HTML::TableParser oder CPAN:HTML::TableExtract weiter...

Generell sollte man HTML-Dateien besser mit CPAN:HTML::Parser durchsuchen...
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
GwenDragon
 2006-07-24 18:37
#10742 #10742
User since
2005-01-17
14533 Artikel
Admin1
[Homepage]
user image
@renee
Na, sowas ganz ähnliches schrieb ich doch auch. :D\n\n

<!--EDIT|GwenDragon|1153752033-->
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

renee
 2006-07-24 18:40
#10743 #10743
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
Heute stimmt hier was mit der Internetverbindung nicht so ganz - und ich bin auch etwas langsam mit dem Antworten...
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
GwenDragon
 2006-07-24 18:41
#10744 #10744
User since
2005-01-17
14533 Artikel
Admin1
[Homepage]
user image
Ach so. Ich dachte die Hitze brütet den Kopf aus ;)
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

<< >> 6 Einträge, 1 Seite



View all threads created 2006-07-24 15:39.