Thread Regex Strategie (5 answers)
Opened by MarkusH at 2018-05-21 11:45

clms
 2018-06-01 21:09
#188491 #188491
User since
2010-08-29
373 Artikel
BenutzerIn
[default_avatar]
Die Levenshtein-Distanz ist eine gute Idee.

Wobei man die Levenshtein-Distanz nicht direkt in einer Regex nutzen kann. Oder hat jemand eine Idee, wie man eine Regex aussehen könnte, die alle Strings mit einer Levenshtein-Distanz von 0-2 zu einem bestimmten String matched?

Was natürlich geht: Einen Substring mit Wildcards per Regex extrahieren und anschließend mit einem der Module aus CPAN die Levenshtein-Distanz zum Target-String ermitteln. Wenn sie zu groß ist, verwirft man den potentiellen Match wieder.

Das Problem ist dann, den zu extrahierenden Substring in der Regex zu verankern. Bei manchen Aufgaben wird das einfach gehen, wenn man an beiden Enden des Substrings eindeutige Markierungen hat, die robust gegen Fehler sind. In anderen Fällen wird es sehr kompliziert werden, wenn man nicht genau abschätzen, wie lang der String sein soll und wo er anfängt und aufhört.

View full thread Regex Strategie