Thread CGI - Response und Umlaute (7 answers)
Opened by webwude at 2013-04-06 18:00

webwude
 2013-04-06 18:00
#166914 #166914
User since
2013-04-06
4 Artikel
BenutzerIn
[default_avatar]
Hallo zusammen,

nachdem ich jetzt schon eine Weile herum gespielt habe, aber einfach nicht weiter komme, nun in dieser Runde, in der Hoffnung, dass mir jemand helfen kann.

Ich habe mir ein kleines Script bastelt, dass ich per Get (mit Mechanize) eine Webseite holt (charset UTF-8), diese nach bestimmten Suchbegriffen durchsucht und ggf. Treffer ausgibt. Soweit so gut.

Beispiel:
Code (perl): (dl )
1
2
3
4
5
$browser->get( $url );
if ( $browser->success( ) )  {
        $content = $browser->response->decoded_content('charset'=>'utf8');
}
 

und später:
Code (perl): (dl )
1
2
my $search = "überhitzung";
if ($content =~ m/$search/) { print "Treffer" };


Ich speichere mir das Ergebnis per $content = $browser->response->decoded_content; ab.
Schau ich nun in die Datei, die ich mir z.B. per Mail zuschicken lasse, sieht alles soweit ganz gut aus, bis auf die Umlaute, die sind weiterhin codiert: "Überhitzung" (statt überhitzung). Gibt es einen komfortablen Weg, diese Umlaute dahingehend zu wieder in "normale" Buchstaben zu konvertieren, so dass ich mittels Match etwa nach "Überhitzung" in der content Variable suchen kann? Bisher führt nur der codierte Buchstabe zum Erfolg.

Irgendwie gehen mir zurzeit die Ideen aus - wie gesagt, ansonsten sieht die Datei gut aus, nur die Umlaute wollen einfach nicht so wie ich... diverse en- und decode Versuche blieben bisher erfolglos - bei Wunsch kann ich gerne weitere Codefragmente posten.

Vielen Dank und viele Grüße,
ww

modedit Editiert von GwenDragon: Bitte Code in Perl-Tags!
Last edited: 2013-04-06 18:01:25 +0200 (CEST)

View full thread CGI - Response und Umlaute