Mining Twitter Data, чтобы найти информацию о пользователе? - PullRequest
1 голос
/ 25 марта 2012

Я начинаю с проекта, который будет анализировать интересы и заинтересованность пользователя через его профиль в твиттере. Какие метрики могут быть получены путем анализа его данных в Твиттере? Вещи, которые я чувствую, могут быть сделаны:

  1. Темы, о которых пользователь больше всего говорит (свои интересы), анализируя свои твиты.
  2. Сообщества, в которых он активен (анализируя хеш-теги)
  3. Настроение человека путем классификации твитов как позитивных / негативных.

Другие тенденции могут включать его охват и людей, с которыми он общается в целом.

Есть ли другие интересные аспекты, которые могут быть получены о человеке через его профиль? Twitalyzer , кажется, также показывает возрастные группы, с которыми человек взаимодействует больше всего, но я не очень понимаю, как это сделать.

Также я планирую разработать проект как веб-приложение. Я планирую использовать PHP для создания сканера. Что касается майнинга, вы бы предложили придерживаться PHP или порекомендовать другую технологию / язык?

Некоторые проекты, которые я искал для вдохновения, включают:

Ответы [ 3 ]

1 голос
/ 28 января 2014

Вы также можете рассмотреть сообщества, в которых он находится. Извлекая упоминания, которые он делает (или те, в которых он упоминал), и создавая график, вы сможете лучше понять пользователя и людей, которые ему интересны. Особенно, если вы введете понятие центральности в своей работе ...

0 голосов
/ 01 февраля 2017

Я бы немного расширил сферу действия за пределы Твиттера, если понимание пользователя является главным приоритетом.

Можно, например, предположить, что тег twitter - это имя пользователя, которое они используют в других сервисах, возможно, даже для распространителей распространенных адресов электронной почты (gmail, yahoo).Если у них есть другие имена учетных записей в их биографии, вы можете проверить их, чтобы узнать, есть ли у них учетная запись на платформах, которые менее ограничены в отношении информации о пользователях.

Если основное внимание было уделено использованию канала Twitter пользователяДумаю, я оставлю это как идею расширения.

0 голосов
/ 25 марта 2012

Анализ лояльности к бренду конкретного человека, особенно если он влиятельный, может быть очень проницательным.

...