Словари для анализа настроений - PullRequest
42 голосов
/ 15 ноября 2010

Мне было интересно, знает ли кто-нибудь, где я могу получить словари положительных и отрицательных слов.Я изучаю анализ настроений, и это важная его часть.

Ответы [ 9 ]

35 голосов
/ 16 ноября 2010

Лексикон настроения в Университете Питтсбурга может быть тем, что вы ищетеЭто лексикон около 8000 слов с позитивным / нейтральным / негативным настроением.Более подробно это описано в этой статье и выпущено под лицензией GPL.

23 голосов
/ 17 февраля 2011

Прибыв немного позже, отмечу, что словари имеют ограниченный вклад в анализ настроений. Некоторые предложения, содержащие чувства, не содержат слова "чувства", например «прочитайте книгу», которая может быть положительной в рецензии на книгу, а негативной - в рецензии на фильм. Точно так же слово «непредсказуемый» может быть положительным в контексте триллера, но отрицательным при описании системы перерывов Toyota.

и еще много ...

12 голосов
/ 18 февраля 2013

Профессор Бин Лю предоставит английский словарь около 6800 слов, вы можете скачать форму по этой ссылке: Анализ мнений, анализ настроений и обнаружение спама

6 голосов
/ 17 ноября 2010

В этой статье за ​​2002 год описан алгоритм автоматического вывода такого словаря из выборок текста, используя только два слова в качестве начального набора.

3 голосов
/ 24 ноября 2015

Справочник словаря Гарварда-IV http://www.wjh.harvard.edu/~inquirer/homecat.htm содержит как минимум два набора готовых к использованию словарей для положительной / отрицательной ориентации.

3 голосов
/ 16 августа 2013

AFINN вы можете найти здесь, а также создать его динамически. Как всякий раз, когда приходит неизвестное + ve слово, добавьте его с +1. Как банан это новое + ве слово и появляется дважды, тогда он станет +2.

Сколько статей и данных вы просканируете, ваш словарь станет сильнее!

2 голосов
/ 07 марта 2017

Вы можете использовать лексикон vader sentiment

from nltk.sentiment.vader import SentimentIntensityAnalyzer

sentence='APPle is good for health'
sid = SentimentIntensityAnalyzer()
ss = sid.polarity_scores(sentence)  
print(ss)

, он даст вам полярность предложения.

вывод:

 {'compound': 0.4404, 'neu': 0.58, 'pos': 0.42, 'neg': 0.0}
1 голос
/ 08 марта 2019

Sentiwords дает 155 000 слов (и их полярность, то есть оценка от -1 до 1 для очень отрицательного или очень положительного)Лексика обсуждается здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...