Алгоритм, чтобы найти один редактировать расстояние слова из входного слова, используя расстояние Левенштейна? - PullRequest
0 голосов
/ 03 апреля 2020

У меня есть словарь, в котором столько слов (примерно 100000). Я беру одно слово от пользователя, которое написано неправильно. Например, это слово «andd». Пользователь всегда пишет неправильно и с одним расстоянием редактирования. Моя программа сканирует все слова и находит все 1 слова расстояния редактирования и в соответствии с их показателями использования возвращает верное правильное написание. Например, он находит и, andy, ande. После этого рассчитайте коэффициент использования и верните одно из них.

Однако моя программа работает очень медленно, когда я беру 300 слов от пользователя. Поэтому я хочу изменить свой код. Во-первых, я хочу создать все слова с расстоянием редактирования 1 от заданного слова и проверить, какие из них в слове. Если слово в тексте, я снова вычислю коэффициент использования и верну его. Таким образом, моя программа не контролирует расстояние редактирования для каждого слова в dict.

Вкратце, я хочу создать все комбинации с расстоянием редактирования 1 от заданного входного слова. Должен ли я добавить весь алфавит и попробовать его везде, или у него есть алгоритм? Я ничего не мог найти на inte rnet. Спасибо всем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...