String manipulation (gelöst) (Allgemeines zu Perl)

[thread]20514[/thread]

String manipulation [gelöst]

Tags: perl5 Substitution Ähnliche Threads

Leser: 14

Articles: hide open all | hide show old branches

+31 replies
Haselnuss992

2018-10-15 15:39

User since
2018-06-28
9 Artikel
BenutzerIn

Hallo zusammen,

Ich werte VDA-Informationen aus und erhalte leider aufgrund eines alten Protokollstandards alle Informationen als durchlaufende Zeichenkette.

sprich mein String besteht bspw. aus 1500 Zeichen (Zahlen,Buchstaben,Leerzeichen).

Nun gibt es kein bestimmtes Zeichen nachdem ich splitten könnte.
Mein einziger Anhaltspunkt ist der - ich weiß, dass jedes Informationsfeld aus 160 Zeichen besteht.

Jetzt wäre meine Frage, ob es via regex möglich wäre nach 160 Zeilen einen Zeilenumbruch zu erzwingen.
Die andere Möglichkeit wäre, nach jeweils 160 Zeichen einen trenner "|" in den String zu schieben, damit ich danach splitten kann.

Ich wüsste wie ich das Problem mit substrings oder zählern lösen könnte, aber falls möglich wäre mir eine substitution bzw. eine Regex bequemer.

Für konstruktive Gedanken wäre ich sehr dankbar, gerne auch weitere Ideen für alternative Lösungen.

LG
Basti
- +10 replies
- Muffi
  
  2018-10-15 15:49
  User since
  2012-07-18
  1465 Artikel
  BenutzerIn
  Na so schlimm ist es wieder auch nicht.
  
  Code (perl): (dl )
  
  1 2 3 4 5 6 7 8 9 10 11 12 13
  
  my $string = 'abcijuwegwegwglwjgwgwhgwkgjnwgkjwngwnmgioghwoöighwghwgökwnglkwhgwohgwelökgnwgklweghgweghwelg,wngwehgwhgweoöhgwegnjwegnwegmwgega'; sub MAXSIZE { 13 }; my @parts = (); my $cur = 0; while ($cur < length($string)) { push @parts, substr($string, $cur, MAXSIZE); $cur += MAXSIZE; } say "@parts";
  
  1 + 1 = 10
  - Haselnuss992
    
    2018-10-15 16:34
    
    User since
    2018-06-28
    9 Artikel
    BenutzerIn
    
    Hey Muffi,
    
    danke für die Lösung, genau so etwas hab ich gesucht, kurz & knackig (trotz substr).
    Ich hab da wohl zu kompliziert gedacht, danke dir!
  - +8 replies
  - Crian
    
    2018-10-16 09:28
    
    User since
    2003-08-04
    5873 Artikel
    ModeratorIn
    
    Warum MAXSIZE als sub?
    s--Pevna-;s.([a-z]).chr((ord($1)-84)%26+97).gee; s^([A-Z])^chr((ord($1)-52)%26+65)^gee;print;
    
    use strict; use warnings; Link zu meiner Perlseite
    - Muffi
      
      2018-10-16 11:10
      
      User since
      2012-07-18
      1465 Artikel
      BenutzerIn
      
      Warum nicht?
      1 + 1 = 10
    - +6 replies
    - GwenDragon
      
      2018-10-16 11:36
      
      User since
      2005-01-17
      14848 Artikel
      Admin1
      
      Weil er vielleicht keine Lust hatte das nervig-lange use constant MAXSIZE => 13; zu schreiben.
      Oder weil er es eben kann, wie Tim Toady sagen würde.
      die Drachin Gwen
      
      Meine Perl-Artikel · perldev – verschiedene Perl-Versionen unter Windows starten
      - +5 replies
      - Muffi
        
        2018-10-16 11:48
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Ah, jetzt kapier ichs erst. Die Frage war warum ich nicht das constant benutz hab!
        
        Einfache Antwort: Ich seh keinen Mehrwert.
        Erstens müsst ichs wahrscheinlich jedesmal googlen, weil ich einfach schlecht drin bin mir Syntax zu merken, die ich nur selten brauch.
        Und zweitens verschleierts was (was ich als eher negativ anseh) ohne groß Vorteile zu bringen.
        1 + 1 = 10
        
        +2 replies
        
        Crian
        
        2018-10-17 11:37
        
        User since
        2003-08-04
        5873 Artikel
        ModeratorIn
        
        Ich meinte das gar nicht wertend, ich war einfach neugierig!
        
        Ich wäre nie auf die Idee gekommen, eine Konstante durch so eine Funktion auszudrücken. Ich finde das aber nicht unbedingt schlecht.
        
        Am schönsten wäre wohl ein
        
        const MAXSIZE = 13;
        
        wenn die Syntax das hergäbe mit const statt my.
        
        So finde ich beide Syntax-Varianten nicht schön und auch die Funktionsschreibweise verschleiert in meinen Augen etwas, auch wenn ich davon ausgebe, dass der Methodenaufruf herausoptimiert wird.
        
        :)
        s--Pevna-;s.([a-z]).chr((ord($1)-84)%26+97).gee; s^([A-Z])^chr((ord($1)-52)%26+65)^gee;print;
        
        use strict; use warnings; Link zu meiner Perlseite
        
        Muffi
        
        2018-10-17 11:53
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Aso.
        
        Quote
        Ich wäre nie auf die Idee gekommen, eine Konstante durch so eine Funktion auszudrücken
        
        Das ist eigentlich recht gängig in Perl. Und "use const" macht unter der Haube auch nix andres.
        Und lieber schreib ichs dann direkt hin, bevor ich mich wunder, was denn
        
        Code (perl): (dl )
        
        $hash{KONSTANTE()}
        
        zu bedeuten hat.
        1 + 1 = 10
        
        +2 replies
        
        GwenDragon
        
        2018-10-17 11:52
        
        User since
        2005-01-17
        14848 Artikel
        Admin1
        
        Gibt aber auch merkwürdige Effekte bei einer Konstante als sub.
        
        #
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
        
        use strict; use warnings; use 5.012; use constant TEST => 99; say TEST + 1; sub TOAST {99}; say TOAST + 1; say &TOAST + 100; __END__ ergibt 100 99 199
        
        Das geht dann nur wenn statt TOAST dann &TOAST geschrieben wird, ist dann auch grässlich.
        Last edited: 2018-10-17 11:56:08 +0200 (CEST)
        die Drachin Gwen
        
        Meine Perl-Artikel · perldev – verschiedene Perl-Versionen unter Windows starten
        
        Muffi
        
        2018-10-17 11:56
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Ja, die üblichen halt. Mit
        
        Code (perl): (dl )
        
        sub TOAST() {99};
        
        gehts
        1 + 1 = 10
- +20 replies
- rosti
  
  2018-10-16 18:28
  User since
  2011-03-19
  3617 Artikel
  BenutzerIn
  Quote
  Nun gibt es kein bestimmtes Zeichen nachdem ich splitten könnte.
  Mein einziger Anhaltspunkt ist der - ich weiß, dass jedes Informationsfeld aus 160 Zeichen besteht.
  
  Zeichen oder Bytes? Ich nehme mal an Du meinst Bytes. Wie auch immmer, die Länge der Datei ist dann ein ganzzahliges Vielfaches von 160. Und um diese Records rauszufischen bietet sich eine Schablone an:
  
  Code (perl): (dl )
  
  1 2 3
  
  # Slurpmode local $/ = undef; my @records = unpack "A160", <$filehandle>;
  
  Wie die Records, von denen jeder eine Länge von 160 Byte hat, weiterzuverabeiten sind, wirst Du sicher wissen, MfG
  Last edited: 2018-10-16 18:30:35 +0200 (CEST)
  http://blog.rolfrost.de/
  
  The art of steam.
  - +3 replies
  - Muffi
    
    2018-10-17 09:26
    
    User since
    2012-07-18
    1465 Artikel
    BenutzerIn
    
    Quote
    (Zahlen,Buchstaben,Leerzeichen).
    
    Seit wann sind Buchstaben Bytes?
    1 + 1 = 10
    - +2 replies
    - rosti
      
      2018-10-17 10:16
      
      User since
      2011-03-19
      3617 Artikel
      BenutzerIn
      
      2018-10-17T07:26:52 Muffi
      Quote
      (Zahlen,Buchstaben,Leerzeichen).
      
      Seit wann sind Buchstaben Bytes?
      
      In Dateien gibt es keine Zahlen,Buchstaben,Leerzeichen sondern nur Bytes. Wie kommst Du auf Zahlen,Buchstaben,Leerzeichen?
      
      MfG
      Last edited: 2018-10-17 10:36:50 +0200 (CEST)
      http://blog.rolfrost.de/
      
      The art of steam.
      - Muffi
        
        2018-10-17 11:08
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Schrieb der Threaderöffner
        
        Quote
        sprich mein String besteht bspw. aus 1500 Zeichen (Zahlen,Buchstaben,Leerzeichen).
        
        1 + 1 = 10
  - +16 replies
  - GwenDragon
    
    2018-10-17 10:45
    
    User since
    2005-01-17
    14848 Artikel
    Admin1
    
    Das Einlesen von XX Bytes als XX Zeichen mit dem template A16 geht bei Unicode-Sequenzen aber schief.
    Siehe https://perldoc.perl.org/perlpacktut.html#Unicode
    
    Kommt eben drauf an was das wirklich für "Zeichen" sind.
    die Drachin Gwen
    
    Meine Perl-Artikel · perldev – verschiedene Perl-Versionen unter Windows starten
    - +15 replies
    - rosti
      
      2018-10-17 10:53
      
      User since
      2011-03-19
      3617 Artikel
      BenutzerIn
      
      2018-10-17T08:45:58 GwenDragon
      Das Einlesen von XX Bytes als XX Zeichen mit dem template A16 geht bei Unicode-Sequenzen aber schief.
      Siehe https://perldoc.perl.org/perlpacktut.html#Unicode
      
      Kommt eben drauf an was das wirklich für "Zeichen" sind.
      
      Nein, es geht nicht schief solange die Länge einer A* Schablone die Anzahl der Bytes fassen kann. Das € Zeichen hat 3 Bytes in UTF-8. Untenstehender String passt also von der Anzahl der Bytes in die A10 Schablone, da geht überhaupt ga nichts schief.
      
      Code (perl): (dl )
      
      1 2
      
      my $s = pack "A10", 'zehn €'; print length $s, "\n", unpack "A10", $s;
      
      MfG
      Last edited: 2018-10-17 11:04:30 +0200 (CEST)
      http://blog.rolfrost.de/
      
      The art of steam.
      - +14 replies
      - Raubtier
        
        2018-10-17 12:15
        
        User since
        2012-05-04
        1081 Artikel
        BenutzerIn
        
        Der Punkt ist doch, wenn du 160 Zeichen hast, dann können das auch mehr als 160 Bytes sein. Sobald die Zeichen in der Datei in einer variabel langen Kodierung wie UTF-8 oder UTF-16 gespeichert ist, kannst du eben nicht brutal 160 Bytes einlesen.
        
        Es waren Umlaute im Beispielstring von Haselnuss992. Wir wissen nicht, wie das open-Kommando lautete, also ob da beispielsweise mit "<:utf8" geöffnet wurde. Wenn ich Buchstaben lese, würde ich nicht binär lesen.
        
        Übrigens ist eine andere, meiner Meinung nach bessere Alternative, $/ zu setzen:
        
        Code (perl): (dl )
        
        my @entries = do { local $/ = \160; <$FH> }
        
        Wenn man eine Datei mit open my $FH, "<:utf8", "file" or die $!; öffnet, liest es 160 Zeichen einer UTF-8 kodierten Datei. Also je nach Modus beim Dateiöffnen.
        Last edited: 2018-10-17 12:33:42 +0200 (CEST)
        
        +6 replies
        
        rosti
        
        2018-10-17 12:32
        
        User since
        2011-03-19
        3617 Artikel
        BenutzerIn
        
        Es kommt darauf an, wie den sein sog. Informationsfeld beschaffen ist. Eine Angabe wie 160 Zeichen ist da deutlich zu wenig und
        Quote
        160 Zeichen in einer Datei
        ist technisch nicht nur irrelevant sondern sogar falsch.
        
        Weil: Dateien keine Zeichen speichern sondern immer Bytes!
        
        Es spricht nichts dagegen, den Inhalt einer Datei zeichenorientiert zu verarbeiten. Aber wann immer es möglich ist, ich würde es byteorientiert tun.
        
        Genau das wäre zu prüfen, das ist der Punkt. MfG
        http://blog.rolfrost.de/
        
        The art of steam.
        
        +5 replies
        
        Raubtier
        
        2018-10-17 12:35
        
        User since
        2012-05-04
        1081 Artikel
        BenutzerIn
        
        Die Bytes in einer Datei sind aber bedeutungslos, wenn du nicht auch angibst, wie sie auszulesen sind. Bei Text (im hier vorliegenden Fall) sind die Bytes nur mit einer Kodierung von irgendeiner Bedeutung. Das kann man doch nicht einfach ignorieren!
        
        Also: Textdateien würde ich nie byteorientiert einlesen. (Es sei denn, ich möchte irgendwelche Raw-Operationen machen wie die Datei zu kopieren)
        Last edited: 2018-10-17 12:38:53 +0200 (CEST)
        
        +4 replies
        
        rosti
        
        2018-10-17 12:47
        
        User since
        2011-03-19
        3617 Artikel
        BenutzerIn
        
        Auch Textdateien enthalten keine Zeichen sondern Bytes. Und eine einfache Prüfung, ob man die Schablone A160 verwenden kann, bestünde darin, festzustellen, ob die Dateien von der Länge her stets ein ganzzahliges Vielfaches von 160 sind. Einfacher gehts nicht:
        
        Code (perl): (dl )
        
        1 2
        
        local $/ = undef; my @units = unpack "A160", <$handle>;
        
        Das ist also meine Alternative.
        
        Quote
        gerne auch weitere Ideen für alternative Lösungen.
        
        Gerne doch, siehe obenstehend, siehe gestern, keine Ursache.
        
        MfG
        Last edited: 2018-10-17 12:50:32 +0200 (CEST)
        http://blog.rolfrost.de/
        
        The art of steam.
        
        +2 replies
        
        Linuxer
        
        2018-10-17 13:46
        
        User since
        2006-01-27
        3891 Artikel
        HausmeisterIn
        
        Deine Lösung liest nur nicht alle 160-Byte-Sequenzen, sondern nur die erste.
        
        edit: Und sie schneidet Leerzeichen am Ende ab.
        edit2: Kann ok sein, muss aber nicht. Man muss sich dessen halt im Klaren sein. [/edit2]
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14
        
        #! /usr/bin/perl use strict; use warnings; use 5.010; #my @parts = do { local $/ = \6; <DATA> }; my @parts = do { local $/; unpack "A6", <DATA> }; say ">$_<" for @parts; __DATA__ Hello World!
        
        Resultat:
        
        Code: (dl )
        
        1 2
        
        $ perl unpack.pl >Hello<
        
        Last edited: 2018-10-17 14:39:36 +0200 (CEST)
        meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
        Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!
        
        rosti
        
        2018-10-17 15:31
        
        User since
        2011-03-19
        3617 Artikel
        BenutzerIn
        
        Quote
        Deine Lösung liest nur nicht alle 160-Byte-Sequenzen, sondern nur die erste.
        
        Stimmt. Richtig wäre, eine zweckmäßige Schablone auf jeden Record anzuwenden.
        
        MfG
        http://blog.rolfrost.de/
        
        The art of steam.
        
        Raubtier
        
        2018-10-17 13:46
        
        User since
        2012-05-04
        1081 Artikel
        BenutzerIn
        
        2018-10-17T10:47:24 rosti
        Und eine einfache Prüfung, ob man die Schablone A160 verwenden kann, bestünde darin, festzustellen, ob die Dateien von der Länge her stets ein ganzzahliges Vielfaches von 160 sind.
        
        Nein, da muss man den Ersteller der Dateien fragen. Du kannst auch zufällig immer Vielfache von 160 erhalten. Und wäre die Datei in UTF-32 kodiert, wären es immer Vielfache von 160. Trotzdem wäre deine Lösung dann falsch.
        
        Aber lassen wir das, das führt offenbar zu nichts.
        
        +7 replies
        
        rosti
        
        2018-10-17 13:16
        
        User since
        2011-03-19
        3617 Artikel
        BenutzerIn
        
        2018-10-17T10:15:26 Raubtier
        Der Punkt ist doch, wenn du 160 Zeichen hast, dann können das auch mehr als 160 Bytes sein. Sobald die Zeichen in der Datei in einer variabel langen Kodierung wie UTF-8 oder UTF-16 gespeichert ist, kannst du eben nicht brutal 160 Bytes einlesen.
        
        Es waren Umlaute im Beispielstring von Haselnuss992. Wir wissen nicht, wie das open-Kommando lautete, also ob da beispielsweise mit "<:utf8" geöffnet wurde. Wenn ich Buchstaben lese, würde ich nicht binär lesen.
        
        Übrigens ist eine andere, meiner Meinung nach bessere Alternative, $/ zu setzen:
        
        Code (perl): (dl )
        
        my @entries = do { local $/ = \160; <$FH> }
        
        Wenn man eine Datei mit open my $FH, "<:utf8", "file" or die $!; öffnet, liest es 160 Zeichen einer UTF-8 kodierten Datei. Also je nach Modus beim Dateiöffnen.
        
        Sobald Du den Layer auf utf-8 schaltest, geht Deine Lösung übrigens in die Hose. Was eben daran liegt, daß Dateien keine Zeichen sondern Bytes speichern (ich wiederhole mich).
        
        MfG
        http://blog.rolfrost.de/
        
        The art of steam.
        
        +6 replies
        
        Raubtier
        
        2018-10-17 13:44
        
        User since
        2012-05-04
        1081 Artikel
        BenutzerIn
        
        2018-10-17T11:16:12 rosti
        Sobald Du den Layer auf utf-8 schaltest, geht Deine Lösung übrigens in die Hose.
        
        Gerade nicht, sie funktioniert dann weiter. Das ist ja gerade, weswegen sie besser ist. Sie liest immer 160 Zeichen.
        
        Edit: Beispiel:
        
        Code: (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
        
        [13:48:33] ~/test$ cat a 12345678901234567890äöüäöüäöüäöüäöüäöüäö [13:48:39] ~/test$ hexdump -C a 00000000 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 |1234567890123456| 00000010 37 38 39 30 c3 a4 c3 b6 c3 bc c3 a4 c3 b6 c3 bc |7890............| 00000020 c3 a4 c3 b6 c3 bc c3 a4 c3 b6 c3 bc c3 a4 c3 b6 |................| 00000030 c3 bc c3 a4 c3 b6 c3 bc c3 a4 c3 b6 0a |.............| 0000003d [13:48:42] ~/test$ perl -MEncode -wE'open my $FH, "<:utf8", "a" or die $!; my @entries = do { local $/ = \5; <$FH> }; say encode_utf8($_) for @entries;' 12345 67890 12345 67890 äöüäö üäöüä öüäöü äöüäö
        
        Last edited: 2018-10-17 13:55:23 +0200 (CEST)
        
        +5 replies
        
        rosti
        
        2018-10-17 15:37
        
        User since
        2011-03-19
        3617 Artikel
        BenutzerIn
        
        Du vermischst Byte- mit Charactersemantics. Um das mal näher zu untersuchen, Länge des Buffers gekürzt von 160 auf 2:
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10
        
        my @u = do { local $/ = \2; <DATA>; }; print Dumper \@u; use utf8; __DATA__ €€€
        
        Sobald Du utf8 einschaltest, kommen jede Menge Warnungen:
        
        Code: (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14
        
        utf8 "\xE2" does not map to Unicode at C:\Dokumente und Einstellungen\rolf\Desktop\pack.pl line 18, <DATA> chunk 1. utf8 "\xAC" does not map to Unicode at C:\Dokumente und Einstellungen\rolf\Desktop\pack.pl line 18, <DATA> chunk 2. utf8 "\x82" does not map to Unicode at C:\Dokumente und Einstellungen\rolf\Desktop\pack.pl line 18, <DATA> chunk 3. utf8 "\xE2" does not map to Unicode at C:\Dokumente und Einstellungen\rolf\Desktop\pack.pl line 18, <DATA> chunk 4. utf8 "\xAC" does not map to Unicode at C:\Dokumente und Einstellungen\rolf\Desktop\pack.pl line 18, <DATA> chunk 5. Malformed UTF-8 character (2 bytes, need 3, after start byte 0xe2) in subroutine entry at C:/Perl/lib/Data/Dumper.pm line 207, <DATA> line 5. Malformed UTF-8 character (unexpected continuation byte 0x82, with no preceding start byte) in subroutine entry at C:/Perl/lib/Data/Dumper.pm line 207, <DATA> line 5. Malformed UTF-8 character (unexpected continuation byte 0xac, with no preceding start byte) in subroutine entry at C:/Perl/lib/Data/Dumper.pm line 207, <DATA> line 5. Malformed UTF-8 character (1 byte, need 3, after start byte 0xe2) in subroutine entry at C:/Perl/lib/Data/Dumper.pm line 207, <DATA> line 5. Malformed UTF-8 character (unexpected continuation byte 0x82, with no preceding start byte) in subroutine entry at C:/Perl/lib/Data/Dumper.pm line 207, <DATA> line 5. Malformed UTF-8 character (unexpected continuation byte 0xac, with no preceding start byte) in subroutine entry at C:/Perl/lib/Data/Dumper.pm line 207, <DATA> line 5. Malformed UTF-8 character (2 bytes, need 3, after start byte 0xe2) in subroutine entry at C:/Perl/lib/Data/Dumper.pm line 207, <DATA> line 5. Malformed UTF-8 character (unexpected continuation byte 0x82, with no preceding start byte) in subroutine entry at C:/Perl/lib/Data/Dumper.pm line 207, <DATA> line 5. Malformed UTF-8 character (unexpected continuation byte 0xac, with no preceding start byte) in subroutine entry at C:/Perl/lib/Data/Dumper.pm line 207, <DATA> line 5.
        
        MfG
        http://blog.rolfrost.de/
        
        The art of steam.
        
        +4 replies
        
        Linuxer
        
        2018-10-17 15:54
        
        User since
        2006-01-27
        3891 Artikel
        HausmeisterIn
        
        Sicher, dass Dein Quell-Code in UTF-8 kodiert ist?
        
        Hier funktioniert es ohne Warnungen:
        
        Ergebnis:
        
        Code: (dl )
        
        1 2 3 4 5
        
        $ perl utf8.pl $VAR1 = [ "\x{20ac}\x{20ac}", "\x{20ac}" ];
        
        mit utf8-kodierter Code-Datei:
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
        
        #! /usr/bin/perl use strict; use warnings; use 5.010; use utf8; use Data::Dumper; my @u = do { local $/ = \2; <DATA>; }; say Dumper \@u; __DATA__ €€€
        
        meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
        Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!
        
        +3 replies
        
        rosti
        
        2018-10-17 16:18
        
        User since
        2011-03-19
        3617 Artikel
        BenutzerIn
        
        Ja, Kodierung stimmt.
        
        Versionsvergleich:
        
        Code: (dl )
        
        This is perl 5, version 16, subversion 3 (v5.16.3) built for MSWin32-x86-multi-thread
        
        http://blog.rolfrost.de/
        
        The art of steam.
        
        +2 replies
        
        Linuxer
        
        2018-10-17 16:24
        
        User since
        2006-01-27
        3891 Artikel
        HausmeisterIn
        
        Mein Test war mit:
        
        Code: (dl )
        
        This is perl 5, version 28, subversion 0 (v5.28.0) built for MSWin32-x64-multi-thread
        
        Neuer Test mit Version 5.10.1:
        
        Code: (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
        
        $ file -i utf8.pl utf8.pl: text/x-perl; charset=utf-8 $ perl utf8.pl utf8 "\xE2" does not map to Unicode at utf8.pl line 11, <DATA> chunk 1. utf8 "\xAC" does not map to Unicode at utf8.pl line 11, <DATA> chunk 2. utf8 "\x82" does not map to Unicode at utf8.pl line 11, <DATA> chunk 3. utf8 "\xE2" does not map to Unicode at utf8.pl line 11, <DATA> chunk 4. utf8 "\xAC" does not map to Unicode at utf8.pl line 11, <DATA> chunk 5. $VAR1 = [ "\x{2080}", "\x{c880}\x{2000}", "\x{ac}\x{c000}", "\x{2080}", "\x{c280} " ]; $ perl -v This is perl, v5.10.1 (*) built for i686-linux-thread-multi
        
        Andere Versionen habe ich derzeit nicht zur Hand.
        Last edited: 2018-10-17 16:29:07 +0200 (CEST)
        meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
        Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!
        
        rosti
        
        2018-10-17 16:38
        
        User since
        2011-03-19
        3617 Artikel
        BenutzerIn
        
        Interessant, vielen Dank!
        
        ALso ist die Unicodeunterstützung immer noch in Bewegung. Ansosnten ist
        
        Code (perl): (dl )
        
        local $/ = \2;
        
        eine klasse Idee, danke Raubtier!
        
        http://perl.rolfrost.de/acf.html
        
        MfG
        Last edited: 2018-10-17 16:40:00 +0200 (CEST)
        http://blog.rolfrost.de/
        
        The art of steam.

View all threads created 2018-10-15 15:39.