Font
[thread]8281[/thread]

Webseite spidern (war: Kan man das so machen? 2)



<< >> 3 entries, 1 page
rk-ger
 2006-08-29 01:14
#69337 #69337
User since
2006-08-07
45 articles
BenutzerIn
[default_avatar]
Hallo,

noch ne Frage.

In der Aufgabe geht es darum, eine Webseite zu spidern und eine ganz bestimmt Tabelle rauszuholen.

Das klappt auch, aber gibt es eine bessere Methode die Whitespaces und Newlines links und rechts wegzuschneiden? Ich halte meine Methode für langsam.

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
use strict;
use warnings;
use HTML::TableExtract; #für die tabelle
use LWP::Simple (); #um die html seite zu holen

my $URL = "http://www.example.com/foo/bar";

my $data = LWP::Simple::get($URL) or die "Side unable to get";


my $te = HTML::TableExtract->new( headers => [qw(Nummer Status-Nr. Datum Zeit Bemerkung Statustext Text2)] );
$te->parse($data);

foreach my $ts ($te->tables) {
foreach my $row ($ts->rows) {
foreach my $lvar (@$row) {
$lvar =~ s/^\s*(.*?)\s*$/$1/; # strip whitespace and newlines
}
print join(',', @$row), "\n";
}
}


Und habe ich eine Möglichkeit, die objektorientierte Schreibweise (z. B. $ts->rows) zu umgehen? Dieses ganze Thema 'objektorientiert' empfinde ich als umständlich und sinnlos. Ich weiss, das ich mit dieser Meinung ziemlich alleine dastehe (und wahrscheinlich ist sie falsch) aber bisher konnte mir noch niemand die Sinnhaftigkeit dieses Programmierstils näher bringen. Aus dem Grund habe ich auch einen früheren Versuch Java zu lernen wieder aufgegeben.

Gruß
Richard
renee
 2006-08-29 09:46
#69338 #69338
User since
2003-08-04
14371 articles
ModeratorIn
[Homepage] [default_avatar]
Man könnte sich ein Konstrukt aus substr bauen... Das dürfte einiges schneller sein.
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
vayu
 2006-08-29 10:16
#69339 #69339
User since
2005-01-13
782 articles
BenutzerIn
[default_avatar]
zuviel zu schreiben und zu faul am frühen morgen :)

http://de.wikipedia.org/wiki/Objektorientierung
<< >> 3 entries, 1 page



View all threads created 2006-08-29 01:14.