Пакет обработки естественного языка - PullRequest
5 голосов
/ 05 марта 2010

Я начал работать над проектом, который требует обработки естественного языка. Мы должны проверить орфографию, а также сопоставить предложения с фразами и их синонимами. Сначала я подумал об использовании GATE, но я не уверен, что использовать? Я нашел интересный пост здесь, который запутал меня еще больше.

http://lordpimpington.com/codespeaks/drupal-5.1/?q=node/5

Пожалуйста, помогите мне решить, что лучше всего подходит для моих целей. Я работаю над веб-приложением, которое будет использовать этот инструмент НЛП в качестве услуги.

Ответы [ 2 ]

6 голосов
/ 05 марта 2010

Вы на самом деле не дали много информации, но попробуйте это: http://www.nltk.org/

Я не думаю, что NLTK выполняет проверку орфографии (я могу ошибаться в этом), но он может выполнять часть речевого тегирования для ввода текста.

Для поиска / сопоставления синонимов вы можете использовать что-то вроде WordNet http://wordnet.princeton.edu/

Если вы делаете что-то действительно специфичное для домена: я бы порекомендовал придумать вашу собственную онтологию для терминов, специфичных для домена.

3 голосов
/ 14 апреля 2011

Если вы используете Python, вы можете разработать программу проверки орфографии с помощью Python Enchant.NLTK также хорош для разработки системы анализа настроений.У меня тоже есть несколько прототипов

Jaggu

...