Лучший способ в PHP найти наиболее похожие строки? - PullRequest
9 голосов
/ 09 февраля 2011

Ад,

В PHP есть много строковых функций, таких как levenshtein, Similar_text и soundex, которые могут сравнивать строки на предмет сходства.http://www.php.net/manual/en/function.levenshtein.php

Что лучше для точности и производительности?

1 Ответ

8 голосов
/ 09 февраля 2011

Similar_text имеет сложность O (max (n, m) ** 3) и Левенштейна сложность O (m * n), где n и m являются длинами строк, поэтому Левенштейн должен быть намного быстрееОба параметра на 100% точны, так как они дают одинаковый выход для одного и того же входа, но выходы для каждой функции будут отличаться.Если вы используете другую меру точности, вам придется создать собственную функцию сравнения.

...