Как рассчитать процент сходства или разницы между двумя текстами / строками? - PullRequest
3 голосов
/ 13 июля 2010

Объясняя это дальше

Предположим, у меня есть две строки, как показано ниже

Я супер мальчик, который умеет летать!Действительно.

Я супер мальчик, который может сломать стены!Действительно.

Так что некоторые символы похожи I am super boy who can и Really ..Есть ли что-нибудь готовое для использования, чтобы найти процентное сходство / различие между этими двумя строками.

Ответы [ 2 ]

4 голосов
/ 13 июля 2010

Вы должны посмотреть на расстояние Левенштейна.

http://en.wikipedia.org/wiki/Levenshtein_distance

0 голосов
/ 07 июля 2016

Этот ТАК ответ на аналогичный вопрос дает код PHP для алгоритмов Левенштейна, Джаро Винклера и Смита Уотермана Гото.

Я обнаружил, что Левенштейн и Джаро Винклер, как правило, дают хорошие результаты для орфографических ошибок между небольшими строками.В то время как Смит Водный Гото хорошо сравнивает предложения , как пример в вашем вопросе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...