use utf8 und Verhalten von String-Operationen (gelöst) - #151106 (Allgemeines zu Perl)

rosti

2011-08-03 17:22

User since
2011-03-19
3811 Artikel
BenutzerIn

Quote
Du siehst, das utf8-Pragma hat keinerlei Einfluss auf das Ergebnis des String-Operationen. Wenn man substr() und uc() bytes liefert, arbeiten sie auf bytes, wenn man ihnen codepoints liefert, arbeiten sie auf codepoints, voellig unabaehngig vom utf8-Pragma.

Ueberzeugt?

Ja, natürlich, keine Frage ;)

Es kommt immer auf die Aufgabenstellung an, Beispiele:

Wenn ich in Perl Character Semantic haben will, gehe ich über die Codepoints. Wenn eine DB-Anbindung vorliegt und Character Semantic im RDBMS gebraucht wird, nutze ich die CS-Methoden des RDBMS. Wenn das RDBMS mit Byte-Sequenzen aus einem Perl-Script klarkommt, brauche ich in Perl keine CS, sondern belasse es bei der Byte Semantic. Wenn ein Perl-CGI Bytessequenzen an einen Webserver schickt, braucht es ebenfalls keine CS in Perl.

Mein Modul CSU ' Character Semantics for UTF-8 ' hat auf Perl v5.6.1 und v5.8.8 bisher jeder Aufgabenstellung genügt, was CS in Sachen Perl betrifft. Ich werde das Modul (alter Name CharTools, seit heute finde ich den Namen CSU besser *G) nicht veröffentlichen, Ihr habt mir zu verstehen gegeben, dass Ihr lieber Encode auf höheren Perl-Versionen benutzt.

--Rolf

https://www.rolfrost.de/

Forum zu Fragen unserer Zeit