Я разрабатываю классную проверку орфографии (я знаю, я знаю, что современные браузеры уже имеют это), в любом случае, мне интересно, какие усилия потребуются для разработки довольно простого, но приличного алгоритма подсказки слов.
Моя идея заключается в том, что я сначала посмотрел бы символы слова с ошибкой и посчитал количество символов, которое ему соответствует, в каждом слове в словаре (требует много ресурсов), а затем выбрал 5 лучших совпадений (так что, если слово с ошибкой соответствует большинство символов с 7 словами из словаря, случайным образом отобразит 5 из этих слов в соответствии с предложенным написанием).
Очевидно, что для более углубленного изучения мы бы посмотрели на «общие слова» и получили файл словаря, который пронумерован с рейтингом «частота употребления этого слова в английском языке». Я думаю, что это немного за борт, может быть.
Что ты думаешь? У кого-нибудь есть идеи для этого?