|< 1 2 3 4 5 >| | 90 Einträge, 5 Seiten |
Thread (Message) | Date | Author | Score | Board |
---|---|---|---|---|
utf8 mit HTML::Treebuilder verarbeiten (#154045) | 2011-11-09 06:40 | Nordlicht | Allgemeines zu Perl | |
... my $content = $response->content; my $root = HTML::TreeBuilder->new_from_content($content); [/code] leider bereitet mir dabei folgende Fehlermeldung Kopfschmerzen: [c]Parsing of… | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154054) | 2011-11-09 12:28 | Nordlicht | Allgemeines zu Perl | |
Das Problem ist... wenn ich für jede der Seiten ein HTML::Treebuilder-Objekt erzeuge wird das Script extrem langsam, weil es andauernd die Bäume aufbauen muss und sie einige Sekunden später wieder… | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154054) | 2011-11-09 12:28 | Nordlicht | Allgemeines zu Perl | |
Das Problem ist... wenn ich für jede der Seiten ein HTML::Treebuilder-Objekt erzeuge wird das Script extrem langsam, weil es andauernd die Bäume aufbauen muss und sie einige Sekunden später wieder… | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154046) | 2011-11-09 07:38 | bianca | Allgemeines zu Perl | |
Dazu steht was beim HTML::Parser: http://search.cpan.org/~gaas/HTML-Parser-3.69/Parser.pm [quote][b]Parsing of undecoded UTF-8 will give garbage when decoding entities[/b] (W) The first chunk… | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154046) | 2011-11-09 07:38 | bianca | Allgemeines zu Perl | |
Dazu steht was beim HTML::Parser: http://search.cpan.org/~gaas/HTML-Parser-3.69/Parser.pm [quote][b]Parsing of undecoded UTF-8 will give garbage when decoding entities[/b] (W) The first chunk… | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154046) | 2011-11-09 07:38 | bianca | Allgemeines zu Perl | |
Dazu steht was beim HTML::Parser: http://search.cpan.org/~gaas/HTML-Parser-3.69/Parser.pm [quote][b]Parsing of undecoded UTF-8 will give garbage when decoding entities[/b] (W) The first chunk… | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154046) | 2011-11-09 07:38 | bianca | Allgemeines zu Perl | |
Dazu steht was beim HTML::Parser: http://search.cpan.org/~gaas/HTML-Parser-3.69/Parser.pm [quote][b]Parsing of undecoded UTF-8 will give garbage when decoding entities[/b] (W) The first chunk… | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154050) | 2011-11-09 11:58 | Nordlicht | Allgemeines zu Perl | |
danke, ich hab es mit [code] use utf8; utf8::decode($content); [/code] gelöst. Ich hatte diesen Ansatz schon versucht und keine Fehlermeldung mehr bekommen. | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154052) | 2011-11-09 12:00 | Nordlicht | Allgemeines zu Perl | |
achso... ja den Hinweis hatte ich gesehen... aber es hat funktioniert ^^ Naja ich probier mal decoded_content. | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154049) | 2011-11-09 11:50 | pq | Allgemeines zu Perl | |
versuch mal statt $response->content die methode decoded_content. | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154053) | 2011-11-09 12:05 | pq | Allgemeines zu Perl | |
du weisst ja vorher nicht, in welcher kodierung der content vorliegt. decoded_content erledigt das für dich, brauchst dich dann nicht mehr kümmern. | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154051) | 2011-11-09 11:56 | pq | Allgemeines zu Perl | |
nicht utf8::decode benutzen! aus der doku von utf8: [quote][b]Do not use this pragma for anything else than telling Perl that your script is written in UTF-8.[/b][/quote] benutz doch einfach… | ||||
utf8 mit HTML::Treebuilder verarbeiten (#154055) | 2011-11-09 12:41 | bianca | Allgemeines zu Perl | |
Je nach dem wäre vielleicht selbst parsen eine Lösung. Ich weiß nicht, wie viele Infos du rausziehen musst und wie umständlich/fehleranfällig das wäre. | ||||
HTML-Seite parsen (#126898) | 2009-10-12 14:14 | pq | Allgemeines zu Perl | |
[cpan]HTML::TreeBuilder::XPath[/cpan] =) | ||||
Suche HTML Parser (#147433) | 2011-04-06 19:26 | topeg | Allgemeines zu Perl | |
… zu [cpan]HTML::Treebuilder[/cpan] auf dieser Seite:[forumsearch=20 boards=10 ]HTML::Treebuilder[/forumsearch] zu [cpan]XML::LibXML[/cpan] auf dieser Seite:[forumsearch=20 boards=10… | ||||
3 Fragen: Trefferliste umstrukturieren, mit gefunden Links weiterarbeiten + wie kann ich nur Teile eines Treffers anzeigen? (#135913) | 2010-04-13 09:58 | pq | Allgemeines zu Perl | |
einfach [cpan]HTML::Treebuilder::XPath[/cpan]? | ||||
LWP::Simple Problem (#173715) | 2014-02-25 20:03 | guest wer | Allgemeines zu Perl | |
erinnert mich man [mod]HTML::TreeBuilder[/mod] | ||||
Regex für n-tes Auftreten eines HTML-Tag Paares (#78238) | 2007-07-06 00:11 | ptk | Allgemeines zu Perl | |
Versuch's mal mit [cpan=HTML::TreeBuilder::XPath]HTML::TreeBuilder::XPath[/cpan]. | ||||
mit perl eine intranet seite steuern: und daten auslesen (#52103) | 2005-02-24 20:00 | pq | Allgemeines zu Perl | |
[cpan=HTML::TreeBuilder]HTML::TreeBuilder[/cpan]\n\n <!--EDIT|pq|1109329742--> | ||||
HTML-Seite parsen (#126896) | 2009-10-12 13:20 | pq | Allgemeines zu Perl | |
vielleicht ist [cpan]HTML::TreeBuilder[/cpan] für deinen fall geeigneter. |
|< 1 2 3 4 5 >| | 90 Einträge, 5 Seiten |