Thread String zerlegen mit REGEXP (8 answers)
Opened by Gast at 2005-04-11 12:56

Gast Gast
 2005-04-11 12:56
#29461 #29461
Hallo zusammen!

Ich habe folgendes Problem, ich möchte die aktuellen Informationen, die ich auf der Internetseite unserer Firma bereitstelle durchsuchen können.
Es handelt sich solch eine Datei für jeden Monat.

Die Zeile mit dem eigentlichen Text der später in eine Datenbank geschrieben werden soll, ist leider manchmal in der html-Datei über zwei Zeilen geschrieben.

            <LI><A STYLE="text-decoration: none" HREF="20030401.htm">Steuerliche Behandlung des Arbeitsentgelts aus
             geringf&uuml;gigen Besch&auml;ftigungen ab dem 1.4.2003</A></LI>

Wenn der Text auf einer Zeile steht ist es nicht das Problem ihn herraus zu ziehen.
Bei zwei Zeilen machts mir Probleme!

Ich versuche es wie folgt:
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
open (DAT, '<', $datei) || die "Kann die Datei $datei nicht laden!";
   my %inhalte;
   my $tmp_var;
   my $secln=0;
   foreach (<DAT>)
{
if ($secln==1)
{
print "$tmp_var $_$ \n";
}
   next unless (/STYLE/);
   if (/.*LI.*STYLE\=.*\"\>(.*)\<\/A.*/)
{
print "$1\n";
$secln=0;
}
   elsif (/.*LI.*STYLE\=.*\"\>(.*)/)
{
$tmp_var=$1;
$secln=1;
next;
}  
}


Ich hoffe mir kann jemand sagen was ich falsch mache!

Vielen Dank schonmal im Voraus

MfG René Albrecht

View full thread String zerlegen mit REGEXP