Thread unicode in perl: unicode in perl (4 answers)
Opened by Gast at 2003-10-21 08:16

Gast Gast
 2003-10-21 08:16
#65784 #65784
hallo perl-freaks!

verwendet jemand schon unicode?

ich habe ein txt datei mit englischen a b c ,deutschen umlauten und russischen buchstaben erstellt
http://www.linuxbox.co.za/~linder/unicode.jpg
dann habe ich das als unicode.txt in utf8-format gespeichert.
und mit diesem script möchte ich den text einlesen,bearbeiten und dann ausgeben (in console und in file).

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
#!/usr/bin/perl -w
use strict;
use utf8;
my $text;
open(FILE,"<unicode8.txt");
open(OUTPUT,">text.txt");
binmode FILE,":utf8";
binmode OUTPUT,":utf8";
binmode STDOUT,":utf8";
while(<FILE>){print OUTPUT $_; $text .=$_}
close FILE;
close OUTPUT;


es klappt bei mir nicht das auszugeben und in regexp zu verwenden

zweites bild - ein abschnitt aus einer doc datei (microsoft word vers 8)
http://www.linuxbox.co.za/~linder/word.jpg
das ist auch unicode. ich muss zuerst alle 0x00 aus der code entfernen und weiter zu arbeiten.
oder weisst jemand wie man damit besser klarkommt?
und das letztes bild:
http://www.linuxbox.co.za/~linder/russisch.jpg
das ist der russische text in word datei.
was kann ich damit machen? umwandeln? parsen?

wenn jemand bescheid weisst oder wo zum thema nachlesen kann (perldoc utf8,unicode usw hab ich schon gelesen) - postet bitte antwort.

vielen dank

Pavel

Editiert von Crian: Code-Tags hinzugefügt\n\n

<!--EDIT|Crian|1066722260-->

View full thread unicode in perl: unicode in perl