То, что вы ищете, обычно называют Анализ настроений . Как правило, анализ настроений не в состоянии справиться с деликатными тонкостями, такими как сарказм или ирония, но он вполне оправдан, если вы добавите в него большой набор данных.
Анализ настроений обычно требует небольшой предварительной обработки. По крайней мере, токенизация, обнаружение границ предложений и маркировка части речи. Иногда синтаксический анализ может быть важным. Правильное выполнение - это целая отрасль исследований в области компьютерной лингвистики, и я бы не советовал вам придумывать собственное решение, если вы сначала не потратите время на изучение области.
В OpenNLP есть несколько инструментов, помогающих анализировать настроения, но если вы хотите что-то более серьезное, вам следует изучить инструментарий LingPipe . Он имеет некоторую встроенную SA-функциональность и хороший учебник . И вы можете обучить его на своем собственном наборе данных, но не думайте, что это совершенно тривиально: -).
Поиск в Google по термину, вероятно, также даст вам некоторые ресурсы для работы. Если у вас есть более конкретный вопрос, просто спросите, я внимательно слежу за nlp-тегом; -)