|
Thread Regex match nicht alle Emoji
(24 answers)
Opened by GwenDragon at 2025-12-10 16:06
Was ChatGPTmini sagt, ich solle das in Perl nehmen: s/[^\p{L}\p{N}\s]+//g;
[quote]Um Unicode-Emojis und andere grafische Symbole aus einer Zeichenkette in Perl zu entfernen, kannst du den folgenden Regex-Ausdruck verwenden. Dieser Ausdruck zielt darauf ab, eine Vielzahl von Unicode-Emoji-Symbolen abzudecken: $string =~ s/[^\p{L}\p{N}\s]+//g; Erklärung s///g: Dies ist der Substitutionsoperator von Perl. Das g am Ende steht für "global", was bedeutet, dass alle Übereinstimmungen in der Zeichenkette ersetzt werden. [^\p{L}\p{N}\s]+: Dies ist ein Negativzeichenklasse: \p{L} erfasst alle Buchstaben (Unicode). \p{N} erfasst alle Zahlen (Unicode). \s erfasst Leerzeichen. Das ^ am Anfang der Zeichenklasse bedeutet, dass alles nicht von diesen Zeichen erfasst werden soll. Beispiel Hier ist ein einfaches Beispiel, um zu verdeutlichen, wie wir das nutzen können: my $string = "Hallo Last edited: 2025-12-11 17:48:48 +0100 (CET) |