Thread UTF-8 Encode HTML::Parser DBI (3 answers)
Opened by kristian at 2009-10-13 22:22

kristian
 2009-10-14 08:56
#126953 #126953
User since
2005-04-14
684 Artikel
BenutzerIn
[Homepage] [default_avatar]
2009-10-13T21:35:54 pq
bei sowas hilft immer CPAN:Devel::Peek, um zu gucken, was genau für bytes in dem string stehen und ob er das utf8-flag hat.


Danke, das bringt mich auf den richtigen Weg.
Die erste Überraschung war die Rückgabe von LWP:
FLAGS = (SMG,POK,pPOK,UTF8)
...
MG_TYPE = PERL_MAGIC_utf8(w)
Uuups....

Beim Nachlesen zu LWP fand ich eben übrigends herraus das ich mir zuviel Mühe mache:
Code (perl): (dl )
1
2
3
4
5
6
7
8
9
    if($res->is_success){
        $result->{'url'}     = $res->request->uri;
        $result->{'charset'} = _suggest_charset($res);
        $result->{'content'} = $res->decoded_content(charset => $result->{'charset'});

        return $result; 
    }else{
.....
}

reicht eigentlich.

Mein Problem entsteht durch die kaputten Daten in kaputten Seiten.
Ich werde mich also um Prüfung der Daten kümmern müssen bzw. prüfen müssen ob decode / encode funktionieren, was sie aber nicht tuen können, das die Daten ja kaputt sind.

Ev. ne Idee wie ich kaputte Daten repariere?
Last edited: 2009-10-14 09:05:23 +0200 (CEST)

View full thread UTF-8 Encode HTML::Parser DBI