Я хочу классифицировать комментарии как положительные или отрицательные в зависимости от содержания. Это проблема NLP (Natural Lang Processing), и я нахожу трудности в ее реализации.
Вот комбинация классификатора, основанного на полууправляемом ко-явлении и неконтролируемого WSD. Хотя в Python. И вам нужен nltk, wordnet, SentiWord-net и корпус обзора фильмов, который поставляется с nltk.
https://github.com/kevincobain2000/sentiment_classifier
Проверьте это сообщение в блоге . Автор описывает, как создать классификатор настроений Twitter с помощью Python и NLTK. Выглядит как хорошее начало, так как анализ настроений - нелегкая задача, когда в этой области ведется множество активных исследований.
Также ищите ТАК для анализа настроений , я думаю, что на сайте уже есть много полезных ответов по этой теме.
Если вы не классифицируете большое количество комментариев, вы можете попробовать использовать chatterboax API
В противном случае вы можете использовать Linpipe , но вам придется тренировать свои модели
Проблема довольно сложная, все равно я люблю Узор : http://www.clips.ua.ac.be/pages/pattern-examples-elections