|
Thread Regex match nicht alle Emoji
(12 answers)
Opened by GwenDragon at 2025-12-10 16:06
Was Du machen könntest:
Den ganzen Text in ein Array mit Codepoints umwandeln und dann für jeden Codepoint die general_category abfragen. UnicodeData.text hat ca 35000 Einträge. Für eine perf. Abfrage muss das in einer Datenbank vorliegen mit dem Codepoint als primary Key. Wie lang sind denn Deine zu untersuchenden Texte? Das Tab. Create-Statement und das Script UnicodeData.text => MySQL kann ich Dir schicken. |