Thread Text aus html Dateien lesen und in Datei schreiben (13 answers)
Opened by binse at 2013-11-28 15:52

clms
 2013-11-28 23:42
#172294 #172294
User since
2010-08-29
373 Artikel
BenutzerIn
[default_avatar]
Zur Einführung in Perl empfehle ich Modern Perl. Das gibt eine knappe aber gute Einführung in die Sprachkonstrukte. Weitere Schwerpunkte sind "best practice" und Fallstricke. Allerdings solltest Du schon programmieren können. Sonst ist die Einführung etwas zu knapp.

Ich selbst habe Perl vor knapp 20 Jahren mit Hilfe der mitgelieferten Doku gelernt, die damals aber noch nicht so umfangreich war. Als Einstieg würde ich da Perldoc:perlintro nehmen.

Ansonsten findest Du in der FAQ Links zu weiteren Büchern und Tutorien.


Für Deine konkrete Problemstellung musst Du drei Aufgaben lösen:

1. Die Verzeichnisstruktur nach Filenamen durchsuchen.
Dazu würde ich wohl zwei verschachtelte Schleifen und Perldoc:perlfunc opendir verwenden. Man kann aber auch ein Modul wie CPAN:File::Find nehmen,

2. Informationen aus dem HTML extrahieren.
Hier würde ich CPAN:HTML::TreeBuilder zum Parsen des HTMLs verwenden. Dann im Baum, den Du bekommst, zum passenden Element gehen und dort mit $elem->as_text() bzw. $elem->attr(...) die gewünschten Informationen rausholen.

3. Die Informationen in einen CSV-File schreiben.
Hier habe ich keine praktische Erfahrung. Ich würde aber in jedem Fall ein CPAN-Module für diese Aufgabe empfehlen.CPAN:Class::CSV könnte ein Kandidat sein.

View full thread Text aus html Dateien lesen und in Datei schreiben