Я начинаю с проекта, который будет анализировать интересы и заинтересованность пользователя через его профиль в твиттере. Какие метрики могут быть получены путем анализа его данных в Твиттере? Вещи, которые я чувствую, могут быть сделаны:
- Темы, о которых пользователь больше всего говорит (свои интересы), анализируя свои твиты.
- Сообщества, в которых он активен (анализируя хеш-теги)
- Настроение человека путем классификации твитов как позитивных / негативных.
Другие тенденции могут включать его охват и людей, с которыми он общается в целом.
Есть ли другие интересные аспекты, которые могут быть получены о человеке через его профиль? Twitalyzer , кажется, также показывает возрастные группы, с которыми человек взаимодействует больше всего, но я не очень понимаю, как это сделать.
Также я планирую разработать проект как веб-приложение. Я планирую использовать PHP для создания сканера. Что касается майнинга, вы бы предложили придерживаться PHP или порекомендовать другую технологию / язык?
Некоторые проекты, которые я искал для вдохновения, включают: