Hallo Community,
ich muss Strings matchen, und herausfinden, wie "aehnlich" sie sich sind. Hab nun Text::Levenshtein und Text::WagnerFischer (was mir sinnvoller erscheint, weil man die edits wichten kann) angeschaut.
Die Herausforderung ist aber: "foo bar" vs. "bar foo" soll einen geringeren Abstand bekommen als "bar foo" vs. "bar muh" z.B., heisst ich muss die Wortpermutationen mit einbeziehen. Bloederweise sind es mehrere tausend Datensaetze, die ich gegeneinander matchen muss, also, einfach alles permutieren ist sicher nicht sinnvoll. Hat jemand eine gescheite Idee, wie man das angehen koennte? Ich brauch nicht unbedingt fertigen Code, nur einen Gedankenanschub. Vllt gibts ja ein Modul, welches ich nicht kenne... Waer nett ;-)
Danke euch.
Last edited: 2014-05-05 21:10:47 +0200 (CEST)