Schrift
[thread]5838[/thread]

unicode in perl: unicode in perl

Tags: Ähnliche Threads

Leser: 3


<< >> 5 Einträge, 1 Seite
Gast Gast
 2003-10-21 08:16
#65784 #65784
hallo perl-freaks!

verwendet jemand schon unicode?

ich habe ein txt datei mit englischen a b c ,deutschen umlauten und russischen buchstaben erstellt
http://www.linuxbox.co.za/~linder/unicode.jpg
dann habe ich das als unicode.txt in utf8-format gespeichert.
und mit diesem script möchte ich den text einlesen,bearbeiten und dann ausgeben (in console und in file).

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
#!/usr/bin/perl -w
use strict;
use utf8;
my $text;
open(FILE,"<unicode8.txt");
open(OUTPUT,">text.txt");
binmode FILE,":utf8";
binmode OUTPUT,":utf8";
binmode STDOUT,":utf8";
while(<FILE>){print OUTPUT $_; $text .=$_}
close FILE;
close OUTPUT;


es klappt bei mir nicht das auszugeben und in regexp zu verwenden

zweites bild - ein abschnitt aus einer doc datei (microsoft word vers 8)
http://www.linuxbox.co.za/~linder/word.jpg
das ist auch unicode. ich muss zuerst alle 0x00 aus der code entfernen und weiter zu arbeiten.
oder weisst jemand wie man damit besser klarkommt?
und das letztes bild:
http://www.linuxbox.co.za/~linder/russisch.jpg
das ist der russische text in word datei.
was kann ich damit machen? umwandeln? parsen?

wenn jemand bescheid weisst oder wo zum thema nachlesen kann (perldoc utf8,unicode usw hab ich schon gelesen) - postet bitte antwort.

vielen dank

Pavel

Editiert von Crian: Code-Tags hinzugefügt\n\n

<!--EDIT|Crian|1066722260-->
kabel
 2003-10-21 14:04
#65785 #65785
User since
2003-08-04
704 Artikel
BenutzerIn
[default_avatar]
die monks wissen mehr:
http://www.perlmonks.org/index.pl?node=unicode&go_button=Search
vielleicht findest du beim stöbern die antwort auf deine frage.

HTH
-- stefan
Geewiz
 2003-10-22 01:53
#65786 #65786
User since
2003-09-29
69 Artikel
BenutzerIn
[Homepage] [default_avatar]
Das Perl Cookbook (O'Reilly Verlag) bietet in den Rezepten 1.5, 1.8, 1.9, und 1.10 ebenfalls hilfreiche Tipps zum Handling von Unicode-Zeichen.
Strat
 2003-10-22 03:18
#65787 #65787
User since
2003-08-04
5246 Artikel
ModeratorIn
[Homepage] [default_avatar]
welche perl-version verwendest du? unicode wird erst ab 5.8 vernuenftig unterstuetzt
perl -le "s::*erlco'unaty.'.dk':e,y;*kn:ai;penmic;;print"
http://www.fabiani.net/
jan10001
 2003-10-22 23:20
#65788 #65788
User since
2003-08-14
962 Artikel
BenutzerIn
[default_avatar]
Hast du dir mal die Unicode Zeichentabellen angesehen?
<< >> 5 Einträge, 1 Seite



View all threads created 2003-10-21 08:16.