Анализ настроений в Twitter: полезные функции - PullRequest
1 голос
/ 30 ноября 2011

Я пытаюсь реализовать функцию анализа настроений и ищу полезные функции, которые можно извлечь из сообщений в твиттере. На данный момент я имею в виду следующие функции:

  1. Слова настроения
  2. Значки эмоций
  3. Восклицательные знаки
  4. Слова отрицания
  5. Слова интенсивности (очень, действительно и т. Д.)

Есть ли еще какие-нибудь полезныеособенности для этой задачи?Моя цель - не только определить, является ли твит положительным или отрицательным, но также мне необходимо определить уровень позитивности или негатива (скажем, по шкале от 0 до 100).Любые материалы или ссылки на печатные документы приветствуются.

Спасибо.

Ответы [ 3 ]

3 голосов
/ 30 ноября 2011

Другие, которые могут быть полезны:

  • удлиненные слова (например, goooood)
  • униграммы и биграммы каждого слова (особенно если у вас большой корпус)

Относительно ссылок: Этот урок Кристофера Поттса очень хорош и по сути: http://sentiment.christopherpotts.net/

Другие документы:

  • Твиттер как корпус для анализа настроений и анализа мнений. Александр Пак, Патрик Парубек
  • Классификация настроений в Twitter с использованием дистанционного наблюдения. Go et al. 2009.
  • Надежное обнаружение настроений в Твиттере по предвзятым и шумным данным. Барбоса и Фенг. 2010
  • Определение силы настроения в коротком неформальном тексте. Thelwall и соавт. (2010). JAIST
2 голосов
/ 01 декабря 2011

Если я опубликую действительно хорошие новости в твиттере, многие люди могут начать публично поздравлять меня.
Так что, если я опубликую X, а затем получу много твитов 'Поздравляю' от других людей, то X, вероятно, положительный.
В общем, тип и частота людей, которые ретвитят мой твит, могут быть связаны с присущим ему чувством.

1 голос
/ 05 декабря 2011

Я бы предложил следующие статьи:

...