Какие существуют стратегии для добавления проверки правописания в программу Google App Engine? - PullRequest
0 голосов
/ 23 марта 2010

Я работаю над программой Google App Engine, которая потребует некоторых базовых функций проверки орфографии. Обычно у iSpell или его кузенов будут варианты, но я не уверен, что это сработает в GEA. Существуют ли другие стратегии / инструменты, которые будут работать в этой среде?

Ответы [ 2 ]

1 голос
/ 23 марта 2010

Очень минимальная, чистая проверка правописания Python может быть найдена здесь: http://norvig.com/spell-correct.html

Файл big.txt, который Норвиг использует для тренировки своей программы проверки орфографии, слишком велик для загрузки в App Engine на 6,2 мегабайта, но из-за NWORDS, полученного в результате обучения, при мариновании только ~ 650K Таким образом, одним из решений может быть предварительная тренировка средства проверки орфографии, получение результатов и включение данных тренировки в ваше приложение.

Эта проверка орфографии может быть недостаточно хороша для ваших нужд, и то, как я предложил вам интегрировать ее в свое приложение, может оказаться совершенно ужасной идеей. Я действительно не уверен. Хотя может быть интересно попробовать.

0 голосов
/ 23 марта 2010

Я лично попытался бы пойти по пути использования API Google для проверки орфографии. Я пытаюсь найти его сейчас, но я полагаю, что их веб-сервис содержит проверку орфографии.

Всегда сложно найти хорошие библиотеки Python, которые на самом деле поддерживаются. С другой стороны, я полагаю, что сервис Google должен быть на некоторое время надежным.

Не уверен, в каком формате возвращаются результаты, но на вашей стороне вы могли бы реализовать собственную формулу расстояния Levenstein , чтобы увидеть, насколько близки результаты к вашему слову.

Mark

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...