Euro Zeichen in MIME (gelöst) (Allgemeines zu Perl)

[thread]17570[/thread]

Euro Zeichen in MIME [gelöst]

Tags: perl5 MIME Euro-Zeichen Ähnliche Threads

Leser: 20

Articles: hide open all | hide show old branches

+11 replies

bianca

2012-07-19 10:10

User since
2009-09-13
7016 Artikel
BenutzerIn

user image

In Folge des Thread Zeichensatz bei MIME::Lite habe ich mir nun also selbst was gebastelt, im Netz gefunden usw.
Das Ergebnis sieht so aus:

Code (perl): (dl )

#!/usr/bin/perl
use strict;
use warnings;
use diagnostics;
use Data::Dumper;

my $testtext = <<TEXTPLAIN
Kleiner Test mit Umlauten:
ae = 'ä'
Ae = 'A'
oe = 'ö'
Oe = 'Ö'
ue = 'ü'
Ue = 'Ü'
ss = 'ß'
Euro = '€'
At = '\@'
TEXTPLAIN
;
print "Mime: ".mime_encode($testtext)."\n\n\n";
print "qp: ".qp_encode($testtext)."\n\n\n";

#--------#
    sub mime_encode {
        return '' if !defined $_[0] || $_[0] eq '';
        my $return = $_[0];
        my $noprint = "\\x00-\\x1F\\x7F-\\xFF";
        my ($word,@lines);
        my $line = '';
        $return =~ s{[a-zA-Z0-9\x7F-\xFF]{1,18}}{
            $word = $&;
            (($word !~ /[$noprint]/o)
            ? $word
            : "=?ISO-8859-15?Q?".&_encode($word,$noprint)."?=");
        }xeg;
        my @words = split(/ /,$return);
        foreach $word (@words) {
            my $sameword = 0;
            if (length($word) > 75) {
                while ($word) {
                    if ($word =~ /^(.+?\?=)(=\?.*)$/) {
                        addword($1,\$line,\@lines,$sameword);
                        $word = $2;
                    }
                    else {
                        addword($word,\$line,\@lines,$sameword);
                        $word = '';
                    }
                    $sameword = 1;
                }
            }
            else { addword($word,\$line,\@lines,$sameword); }
        }
        push(@lines,$line."\n") if ($line);
        return substr(join('',@lines),1);
        sub addword {
            my ($word,$line,$lines,$sameword) = @_;
            if (!$sameword && $word =~ /^=\?[^\?]+?\?[Qq]\?(.+\?=)$/) {
                my $newword = $1;
                if ($$line =~ /^(.+)\?=$/) {
                    $$line = $1.'_';
                    if (length($$line) + length($newword) > $75) {
                        $$line .= '?=';
                        push(@$lines,$$line."\n");
                        $$line = ' '.$word;
                    }
                    else { $$line .= $newword }
                    return 0;
                }
            }
            if (length($$line) > 0 && length($$line) + length($word) > 75) {
                push(@$lines,$$line."\n");
                $$line = '';
            }
            $$line .= ' '.$word;
        }
        sub _encode {
            my ($str,$noprint) = @_;
            $str =~ s{[\?\=\_$noprint]}{sprintf("=%02X",ord($&))}eog;
            $str;
        }
    }

    sub qp_encode {
        my $text = shift;
        $text =~ s/([^ \t\n!-<>-~])/sprintf("=%02X", ord($1))/eg;
        $text =~ s/([ \t]+)$/
            join('', map { sprintf("=%02X", ord($_)) } split('', $1))/egm;
        my $ret = '';
        $ret .= "$1=\n"
            while $text =~ s/(.*?^[^\n]{73} (?:
             [^=\n]{2} (?! [^=\n]{0,1} $)
            |[^=\n]    (?! [^=\n]{0,2} $)
            |          (?! [^=\n]{0,3} $)
            ))//xsm;
        $ret.$text;
    }

Problem ist das Euro-Zeichen. Wenn ich obiges Script in ANSI in Notepad++ speichere bringt es mir =80 raus.
Konvertiere ich das Script in UTF-8 dann bringt es mir für das Euro-Zeichen =E2=82=AC raus.
Sende ich nun mit dem Script als ANSI eine Mail erscheint in den Mailclients alles korrekt bis auf das Euro-Zeichen.
Sende ich die Mail mit dem selben Script als UTF-8 sind alle Umlaute falsch, das Euro-Zeichen ist dann korrekt.

Liegt das vielleicht daran, dass Notepad++ im ANSI Format in latin-1 speichert und dort das Euro-Zeichen nicht kennt? Oder habe ich einen Fehler im Script?
Danke

10 print "Hallo"
20 goto 10

+2 replies
Muffi

2012-07-19 10:32

User since
2012-07-18
1465 Artikel
BenutzerIn

Ich hatte mal ein ähnliches Problem und habs dadurch gelöst, dass ich von
ISO-8859-15 auf ISO-8859-1 umgestellt hab.
Ich weiss bis heute nicht warums damit ging, eigentlich machts keinen Sinn für mich.
Last edited: 2012-07-19 10:50:22 +0200 (CEST)
1 + 1 = 10
- bianca
  
  2012-07-19 10:53
  
  User since
  2009-09-13
  7016 Artikel
  BenutzerIn
  
  2012-07-19T08:32:20 Muffi
  Ich hatte mal ein ähnliches Problem und habs dadurch gelöst, dass ich von
  ISO-8859-15 auf ISO-8859-1 umgestellt hab.
  
  Was genau hast du umgestellt?
  Bei QP wird ja eigentlich kein charset mitgegeben.
  Und beim MIME ändert sich ja das Euro-Zeichen nicht von =80 in =E2=82=AC, nur weil ich -1 statt 15 in der Konstante schreibe.
  10 print "Hallo"
  20 goto 10
bianca

2012-07-19 10:47

User since
2009-09-13
7016 Artikel
BenutzerIn

Ich sehe hier eine Antwort von Muffi, wenn ich auf Antworten klicke kommt Error: Argument-Exception: Message '160047' does not exist or is deleted

Muffi's Post erscheint auch nicht in der Liste "Letzte 24h".
Ist da was kaputt?

Edit: Und jetzt steht da "Noch nicht freigegeben"???
10 print "Hallo"
20 goto 10
+7 replies
bianca

2012-07-19 11:35

User since
2009-09-13
7016 Artikel
BenutzerIn

Ist erledigt.
Lag tatsächlich am Editor.
Wenn ich das Euro-Zeichen über CGI ins Script nehme wird alles korrekt kodiert und auch im Mailclient dargestellt.

Edit: A4 ist der korrekte Code, soweit ich das sehe.
Last edited: 2012-07-19 11:44:45 +0200 (CEST)
10 print "Hallo"
20 goto 10
- +6 replies
- GwenDragon
  
  2012-07-19 12:03
  
  User since
  2005-01-17
  14945 Artikel
  Admin1
  
  Das Euro-Zeichen ist in UTF \u20AC
  bzw. in Perls Notation "\N{EURO SIGN}"
  http://www.fileformat.info/info/unicode/char/20ac/...
  
  in ISO-8859-15 ist es
  //EDIT: \xA4
  Last edited: 2012-07-19 14:11:42 +0200 (CEST)
  die Drachin Gwen
  
  Meine Perl-Artikel · perldev – verschiedene Perl-Versionen unter Windows starten
  - +5 replies
  - bianca
    
    2012-07-19 12:09
    
    User since
    2009-09-13
    7016 Artikel
    BenutzerIn
    
    2012-07-19T10:03:21 GwenDragon
    in ISO-8859-15 ist es \xAC
    
    Danke dir.
    Bei mir zeigt es A4 an und damit funktionieren alle getesteten Stellen.
    Keine Ahnung warum. :)
    10 print "Hallo"
    20 goto 10
    - +4 replies
    - GwenDragon
      
      2012-07-19 14:12
      
      User since
      2005-01-17
      14945 Artikel
      Admin1
      
      War ein Vertipper meinerseits! \xA4 ist korrekt.
      die Drachin Gwen
      
      Meine Perl-Artikel · perldev – verschiedene Perl-Versionen unter Windows starten
      - +3 replies
      - bianca
        
        2012-07-19 17:10
        
        User since
        2009-09-13
        7016 Artikel
        BenutzerIn
        
        Danke für die Bestätigung.
        10 print "Hallo"
        20 goto 10
        
        +2 replies
        
        GwenDragon
        
        2012-07-19 17:12
        
        User since
        2005-01-17
        14945 Artikel
        Admin1
        
        Klar, war je meine Dummheit. ;)
        die Drachin Gwen
        
        Meine Perl-Artikel · perldev – verschiedene Perl-Versionen unter Windows starten
        
        bianca
        
        2012-07-19 17:14
        
        User since
        2009-09-13
        7016 Artikel
        BenutzerIn
        
        2012-07-19T15:12:58 GwenDragon
        Klar, war je meine Dummheit. ;)
        
        Ja, ist mir schon wichtig. Hatte schon wieder Zweifel an meinen Lösungen...wo ich mit Zeichencodierung generell eh noch nicht die Friedenspfeife geraucht habe... :)
        10 print "Hallo"
        20 goto 10

View all threads created 2012-07-19 10:10.