Я не пробовал проводить неподготовленный анализ настроений, который вы описываете, но я бы сказал, что вы упрощаете проблему.Простого анализа прилагательных недостаточно, чтобы понять смысл текста;например, рассмотрим слово «глупый».В одиночку вы бы классифицировали это как отрицательное, но если бы обзор продукта имел «… [x] продукт заставляет их конкурентов выглядеть глупо, если они не думают об этой функции в первую очередь…», тогда настроение там определенно будет положительным,Более широкий контекст, в котором появляются слова, определенно имеет значение для чего-то подобного.Вот почему одного неподготовленного подхода к сумме слов (не говоря уже о еще более ограниченном наборе прилагательных) недостаточно для адекватного решения этой проблемы.
Предварительно классифицированные данные («данные обучения»)) помогает в том, что проблема переходит от попытки определить, является ли текст положительным или отрицательным настроением с нуля, к попытке определить, является ли текст более похожим на положительный текст или отрицательный текст, и классифицировать его таким образом.Другим важным моментом является то, что на текстовый анализ, такой как анализ настроений, часто сильно влияют различия характеристик текстов в зависимости от предметной области.Вот почему наличие хорошего набора данных для обучения (то есть точных данных из той области, в которой вы работаете, и, как мы надеемся, представляет тексты, которые вы собираетесь классифицировать), так же важно, как и создание хорошегоСистема для классификации.
Не совсем статья, но надеюсь, что это поможет.