Есть ли способ идентифицировать или вернуть символы, способствующие разнице между двумя словами на расстоянии редактирования в python? - PullRequest
0 голосов
/ 19 марта 2020

Я ищу найти шаблоны в орфографических ошибках. Я могу использовать расстояние редактирования, чтобы увидеть, насколько похожи 2 слова (правильное слово и слово-кандидат). Однако мне также интересно узнать, какие персонажи способствуют созданию разницы между двумя словами.

1 Ответ

0 голосов
/ 19 марта 2020

Это зависит от библиотеки и метода, который вы используете. Например, в этой библиотеке вы можете использовать функцию editops, чтобы найти все операции редактирования в дополнение к расстоянию Левенштейна двух строк:

editops('spam', 'park')
# [('delete', 0, 0), ('insert', 3, 2), ('replace', 3, 3)]
...