Schrift
Wiki:Tipp zum Debugging: use Data::Dumper; local $Data::Dumper::Useqq = 1; print Dumper \@var;
[thread]7096[/thread]

reg ex für profis: ;)



<< >> 5 Einträge, 1 Seite
rio
 2005-07-03 14:41
#55929 #55929
User since
2004-05-31
105 Artikel
BenutzerIn
[default_avatar]
hi leute, ich bins wiedermal und hab wiedermal ein problem mit RegEx und zwar folgendes

aus diesem schnipsel will ih ausschneiden und zwar das datum ,art der veranstaltung und den text dazu
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
    <tr> 
        <td width="19%" height="16" valign="top"><img src="http://discoserver.itnt.de/Webs/Prisma/Programm/pulse1.jpg.jpg" width="90" height="128"></td>
        <td width="81%" valign="top"><table width="100%" cellspacing="3" cellpadding="0">
               
 <tr>
               
     <td width="3%"><div align="center"><img src="/images/dreieck2.gif" width="7" height="7"></div></td>
               
     <td width="97%" class="titles"><strong><font color="">Fr. 8. Juli - Pulsedriver</font></strong></td>
               
 </tr>
               
 <tr>
               
     <td><img src="/images/trans.gif" height="14"></td>
               
     <td valign="top">>> Vagabonds >> Lovestern Galaktika >> Aqualoop
<br>Einer der bekantesten und erfolgreichsten DJ&’s und Remixer der Nation lässt heute Nacht den Dancefloor des Prisma beben!
<br>&“Best National Remixer 02/03&” >> Remixe für KIM WILDE, LASGO, IAN VAN DAHL, MILK INC., VENGABOYS, U96, BROOKLYN BOUNCE, FRAGMA >>
<br><b>Location: Disco
<br>
<br>Boogie Nights</b> DJ Rich Boogie & MC Prince P. Location: Lüstern
<br>
<br>Heute Frühbucher-Ticket bis 23.00 Uhr an der Abendkasse!</td>
               
 </tr>
        </table></td>
    </tr>
    
    <tr>
        <td width="19%" height="16" valign="top"><img src="http://discoserver.itnt.de/Webs/Prisma/Programm/groove-single.jpg" width="90" height="128"></td>
        <td width="81%" valign="top"><table width="100%" cellspacing="3" cellpadding="0">
               
 <tr>
               
     <td width="3%"><div align="center"><img src="/images/dreieck2.gif" width="7" height="7"></div></td>
               
     <td width="97%" class="titles"><strong><font color="">Fr. 15. Juli - Groove Coverage live</font></strong></td>
               
 </tr>
               
 <tr>
               
     <td><img src="/images/trans.gif" height="14"></td>
               
     <td valign="top"><b>Deutschlands erfolgreichster Dance-Live-Act!</b> Mit &„Poison&“ sind sie auf Anhieb in die UK-Charts eingestiegen! Für ihre neue Single &„Holy Virgin&“ hat sich GC wieder mächtig ins Zeug gelegt &– noch vor der offiziellen Veröffentlichung bekommt ihr diesen Track und alle anderen GC-Smash-Hits heute Nacht live!
<br>>> Holy Virgin >> Poison >> Moonlight Shadow >> God is a girl
<br>Boogie Nights DJ Rich <b>Boogie & MC Prince P.</b> Location: Lüstern
<br>
<br>Heute Frühbucher-Ticket bis 23.00 Uhr an der Abendkasse!</td>
               
 </tr>
        </table></td>
    </tr>


so sieht mein pattern aus
Code: (dl )
1
2
3
4
5
6
7
8
9
10
<td width="97%" class="titles"><strong><font color="">... ([0-9]{1,2}). ([a-zA-Z]{1,20}) - (.*?)</font></strong></td>
               
 </tr>
               
 <tr>
               
     <td><img src="/images/trans.gif" height="14"></td>
               
     <td valign="top">(.*)
<br>


der schneidet aber nicht nur bis zum BR aus, sonder bis zum nächsten img src und  das sieht dann so aus
http://80.132.115.62/cgi-bin/4printenv.pl
(die PM sachen nicht beachten das is was anderes funktioniert aber schon nur PRISMA nicht)

http://www.prisma-nachterlebniswelt.de/Programm das is die orginal seite

ih krichs auf gedeih und verderb nicht hin... hab mir nen editor runter geladen, aber der sagt auh das mein pattern richtig ist kann mir bite wer helfen , wo ist mein fehler ?! ih sehs nicht\n\n

<!--EDIT|rio|1120387405-->
renee
 2005-07-03 19:59
#55930 #55930
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
Für so etwas lohnt es sich, sich in CPAN:HTML::Parser einzuarbeiten. Die ganzen HTML-Regex-Sachen sind sehr komplex und sehr fehleranfällig. Warum sollte man sich Arbeit machen, die für einen schon gelöst wurde...
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
rio
 2005-07-04 14:05
#55931 #55931
User since
2004-05-31
105 Artikel
BenutzerIn
[default_avatar]
das html der seite die ich parsen will ist fürn arsch da erd ih mti sonem parser niht weit kommen denk ich
renee
 2005-07-04 15:27
#55932 #55932
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
Ausprobieren. Warum sollte der Parser nicht damit zurechtkommen??
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
Crian
 2005-07-05 12:25
#55933 #55933
User since
2003-08-04
5866 Artikel
ModeratorIn
[Homepage]
user image
Oben .*? oder [^<>]* statt .* probieren

unten dann

<td valign="top">((?:(?!</td>).)+)</td>

Das fängt alles bis zum schließenden td-Tag.\n\n

<!--EDIT|Crian|1120552242-->
s--Pevna-;s.([a-z]).chr((ord($1)-84)%26+97).gee; s^([A-Z])^chr((ord($1)-52)%26+65)^gee;print;

use strict; use warnings; Link zu meiner Perlseite
<< >> 5 Einträge, 1 Seite



View all threads created 2005-07-03 14:41.