Thread mein script verweigert ignore_case in utf-8 pattern matching (23 answers)
Opened by technix at 2013-06-02 16:19

technix
 2013-06-03 19:00
#167919 #167919
User since
2013-06-02
10 Artikel
BenutzerIn
[default_avatar]
Ich hab probiert, die Textdatei jetzt UTF-8 codiert einzulesen, das ging problemlos, aber bewirkt, daß die Daten im browser nicht mehr richtig (sondern mit den schwarzen Vierecken) ausgegeben werden.
Die Suchfunktionen liefern dann auch keine brauchbaren Ergebnisse mehr, also lese ich die utf-8 Textdatei mit dem utf-8 codierten perlscript wieder ohne ...<:encoding(UTF-8)... im open Befehl ein und alles paßt wieder, mit Ausnahme des ignore case modifiers beim pattern matching.

Es sind 812 Zeilen Code ... ich arbeite daran, ein Beispiel online zu stellen, mit dem es sich dann auch experimentieren läßt.

Ich probiere alles aus, was ihr mit vorschlagt, danke jedem und jeder der da schon geholfen hat!

nur das von pq empfohlene Devel::Peek mag mich nicht, das geht wohl im Perl-Editor 'daheim' aber online liefert es keine Ergebnisse, das mag auch an der browsr Ausgabe liegen. Auch hier experimentere ich noch.

Eure Script Beispiele laufen bei mir problemlos und helfen auch, diese Unicode Sache etwas besser zu verstehen. Ich versuche da auch Grundlagen nachzuholen, muß das Zeug aber bald wieder so hinkriegen, daß die Groß-/Kleinschreibung in der Suche ignoriert wird. "Er" findet ja kleine 'ö' und große 'Ö' aber ignore-case geht nicht und wäre ganz wichtig.

Noch eine Kleinigkeit am Rande; wenn ich am Anfang des Skripts das Pragma use utf8; setze, dann verschwinden die Umlaute aus meiner Suchvariablen (ich lasse mir die vor dem Start der Suche noch anzeigen). Das habe ich also auch sofort wieder entfernt.

Ich melde mich wieder, wenn ein Beispiel verfügbar ist.
Herzlichen Dank inzwischen!
Last edited: 2013-06-03 19:09:51 +0200 (CEST)

View full thread mein script verweigert ignore_case in utf-8 pattern matching