regexp -> html datein durschsuchen (Allgemeines zu Perl)

[thread]7478[/thread]

regexp -> html datein durschsuchen

e-weder

2005-11-17 13:58

User since
2005-11-08
31 Artikel
BenutzerIn
[default_avatar]

hallo
hab da mal eine frage und hoffe ihr könnt mir helfen.

folgender ausgangspunkt.Ich habe eine html datei wie folgt:

Code: (dl )

......
<center><br><font color="#008000">www.webseite.de</font>
<br></center><font color="#008000">www.<b>homepage</b>.de</font>
.....

nun will ich alles was zwichen ... ist, in eine arrey haben!

wie löse ich das am besten?

mfg e-weder

pktm

2005-11-17 14:18

User since
2003-08-07
2921 Artikel
BenutzerIn

Mit HTML::Parser, HTML::Tokeparser oder HTML::TreeBuilder. Ersteres ist das Standardmodul, das zweite finde ich recht komfortabel und das dritte fand wer anderes ganz gut.

http://www.intergastro-service.de (mein erstes CMS :) )

pKai

2005-11-17 14:22

User since
2005-02-18
357 Artikel
BenutzerIn
[default_avatar]

Wenn die Variable $file bereits dem kompletten Dateiinhalt enthält:

Quote
my $hstart = quotemeta '';
my $hend = quotemeta '';

my @Arr = $file =~ /$hstart(.*?)$hend/osg;

Ob das "am besten" ist kommt auf dein Programm(umfeld) an.

I sense a soul in search of answers.

Dubu

2005-11-17 16:25

User since
2003-08-04
2145 Artikel
ModeratorIn + EditorIn

user image

@pKai: Dann hoffst du aber, dass innerhalb des ... kein weiteres font-Tag auftaucht.

Und zum /o-Flag sollte man dazu sagen, dass man es wirklich nur dann verwenden soll, wenn sich $hstart und $hend garantiert nie zwischen zwei Aufrufen der Regex aendern.

Crian

2005-11-17 16:30

User since
2003-08-04
5881 Artikel
ModeratorIn

Es gibt gute Gründe, die genannten Module zu verwenden, es sei denn, man hat die HTML-Dateien selbst per Programm erzeugt und kann sich auf einen Haufen Sachen verlassen, auf den man sich normalerweise nicht verlassen kann. Und selbst dann besteht immer noch die Möglichkeit, sich in den Fuß zu schießen ^^

s--Pevna-;s.([a-z]).chr((ord($1)-84)%26+97).gee; s^([A-Z])^chr((ord($1)-52)%26+65)^gee;print;

use strict; use warnings; Link zu meiner Perlseite

ptk

2005-11-18 00:52

User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]

[quote=pktm,17.11.2005, 13:18]Mit HTML::Parser, HTML::Tokeparser oder HTML::TreeBuilder. Ersteres ist das Standardmodul, [/quote]
Nein. Vielleicht bei ActivePerl, aber nicht bei der "richtigen" Perl-Distribution:

Code: (dl )

1
2
3

corelist HTML::Parser

HTML::Parser  was not in CORE (or so I think)

Quote
das zweite finde ich recht komfortabel und das dritte fand wer anderes ganz gut.

Ich vielleicht? Heute morgen musste ich das Parsen einer HTML-Seite schnell umstellen. Das ging mit HTML::TreeBuilder ganz einfach.

renee

2005-11-18 11:29

User since
2003-08-04
14371 Artikel
ModeratorIn

HTML::Parser findest Du auch einen kleinen Wiki-Artikel unter den FAQ

OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/

View all threads created 2005-11-17 13:58.