Ищите API, похожий на Проверка орфографии в Java - PullRequest
2 голосов
/ 01 марта 2012

У меня есть список слов в текстовом файле.Я хочу, чтобы для входного слова был список слов, которые похожи на входное слово.Таким образом, программа должна работать аналогично API для проверки орфографии, за исключением того, что словарь ограничен моим списком слов.

Я могу написать собственный код, если получу несколько указателей на алгоритм проверки орфографии или регулярные выражения.

Спасибо за помощь, Балкришна.

Ответы [ 3 ]

2 голосов
/ 01 марта 2012

Взгляните на Apache Commons Lang StringUtils.getLevenshteinDistance. Алгоритм Левенштейна дает «расстояние редактирования» между двумя словами, то есть насколько они похожи. Их реализация довольно быстрая - я проверил ее по сравнению с другой реализацией, которую нашел в Интернете, и примерно на 1/3 быстрее, если я правильно помню.

2 голосов
/ 01 марта 2012

Я настоятельно рекомендую взглянуть на статью Peter Norvig о Как написать корректор орфографии Это стоит прочитать.И это не связано со слишком большой сложностью.Если вы прокрутите страницу вниз, вы увидите ссылки на реализации Java.Затем вы можете настроить его под свои нужды.

0 голосов
/ 01 марта 2012
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...