Алгоритмы для исправления орфографии - PullRequest
0 голосов
/ 03 октября 2019

Может кто-нибудь предложить мне некоторые алгоритмы для исправления орфографии, я работаю над проектом текстового процессора. Я попытался nltk.jaccard_distance (), он слишком медленный, чтобы проверить длинную статью с расстоянием до jaccard.

Пожалуйста, предложите некоторые алгоритмы и источники, чтобы изучить их.

Спасибо

1 Ответ

0 голосов
/ 03 октября 2019

Вы можете перейти на расстояние Левенштейна, что он будет делать, чтобы проверить расстояние между двумя словами, оригиналом и входным словом, так что на основе расстояния он решит, исправить ли орфографию или нет. Или вы можете пойти на нечеткие или проверки орфографии.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...