Обычно цитируемым «вводным» справочником является Основы статистической обработки естественного языка (1999) от Manning & Shutze.Хотя это всеобъемлющее, относительно доступное и, безусловно, отличное справочное пособие, это может быть излишним для более случайного знакомства с этой областью.
Вы можете найти некоторые онлайн-курсы, такие как Краткий курс по статистическим методамв НЛП
А также, поскольку вы упомянули Java, вы можете найти общий «набор инструментов», такой как
и начинайте практическое воздействие на определенные области НЛП, такие как, скажем, POS-тегирование или извлечение объектов.
Также достойноСледует упомянуть, что «хотя он связан с NLTK на основе Python, электронная книга Обработка естественного языка с Python (и печатная копия) представляет собой очень практическое руководство по распространенным задачам НЛП.
Есть небольшая загвоздка с мокрыми ногами от НЛП: это крысаее обширная область изучения и практики.Он изобилует как научными исследованиями, так и проверенными временем и отраслью практиками и библиотеками.До тех пор, пока кто-то не будет лучше понимать конкретные приложения НЛП, которые подходят для данной проблемы, можно тратить много времени на изучение технологий, которые либо являются незрелыми, либо плохо подходят для рассматриваемых проблем.