Schrift
[thread]6408[/thread]

Pattern-Matching: Suchen nach einer bestimmten Zeichenfolg



<< >> 3 Einträge, 1 Seite
Gast Gast
 2004-07-16 20:26
#84552 #84552
Hallo,

ich habe eine arabische Internetseite und lese den HTML-Code in eine Textdatei ein. Danan werden alle Tags entfernt und dann soll nach einem bestimmten arabischen Buchstaben suchen. Dieser wird in Unicode angegeben.
Kennt jemand einen regulären Ausdruck zum Matchen nach einer Unicode-Zeichenfolge?

Viele Grüße
Lucky
Ishka
 2004-07-16 20:29
#84553 #84553
User since
2003-08-04
771 Artikel
HausmeisterIn
[Homepage] [default_avatar]
Unicode sind einfach nur mehrere Byte hintereinander, also solltest du nach der Zeichenkombination für dieses Zeichen suchen.

edit: In Html kann das auch n &ü‡—†» (irgend ne Zahl halt) sein.\n\n

<!--EDIT|Ishka|1089995430-->
sub z{if(@_){1while$x[$k=rand 10];t($t=$x[$k]=1)}print map"$z[$x[$_]]$_".($_%3?
"":"\n"),1..9}sub t{$j=0;$x[$_+1]==$t&&($j+=2**$_)for 0..8;z,die"Gewinner $z[$t]
"if grep$_==($j&$_),7,56,73,84,146,273,292,448;z,die"Gleichstand\n"if@x>9&&!grep
!$_,@x}@x=4;@z=qw{. [ (};z$^T&1;while(<>){next if$_>9||$x[$_];t$t=$x[$_]=2;z 1}
ptk
 2004-07-16 21:27
#84554 #84554
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
Wenn du ein neues perl benutzt (Version groesser als 5.8.0) und perl weiss, dass es sich um utf-8 handelt, dann kann man z.B. folgendes benutzen:
Code: (dl )
$string =~ /\x{0627}/
um auf ARABIC LETTER ALEF zu matchen.

Weitere Hinweise duerfte "perldoc perlunicode" bereithalten.
<< >> 3 Einträge, 1 Seite



View all threads created 2004-07-16 20:26.