Нужны ресурсы для статистической обработки естественного языка - PullRequest
3 голосов
/ 24 августа 2011

Я пишу программу на Java, которая должна анализировать естественный язык.Мне нужно, чтобы это было сделано с использованием вероятности и статистики.Существуют ли ресурсы, которые могут легко объяснить методы статистической обработки естественного языка?

1 Ответ

8 голосов
/ 24 августа 2011

Обычно цитируемым «вводным» справочником является Основы статистической обработки естественного языка (1999) от Manning & Shutze.Хотя это всеобъемлющее, относительно доступное и, безусловно, отличное справочное пособие, это может быть излишним для более случайного знакомства с этой областью.

Вы можете найти некоторые онлайн-курсы, такие как Краткий курс по статистическим методамв НЛП

А также, поскольку вы упомянули Java, вы можете найти общий «набор инструментов», такой как

и начинайте практическое воздействие на определенные области НЛП, такие как, скажем, POS-тегирование или извлечение объектов.
Также достойноСледует упомянуть, что «хотя он связан с NLTK на основе Python, электронная книга Обработка естественного языка с Python (и печатная копия) представляет собой очень практическое руководство по распространенным задачам НЛП.

Есть небольшая загвоздка с мокрыми ногами от НЛП: это крысаее обширная область изучения и практики.Он изобилует как научными исследованиями, так и проверенными временем и отраслью практиками и библиотеками.До тех пор, пока кто-то не будет лучше понимать конкретные приложения НЛП, которые подходят для данной проблемы, можно тратить много времени на изучение технологий, которые либо являются незрелыми, либо плохо подходят для рассматриваемых проблем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...