Об интеллектуальном анализе данных с использованием данных Twitter - PullRequest
0 голосов
/ 15 октября 2011

Я планирую написать тезис об использовании информации о настроениях, чтобы повысить предсказуемость некоторых финансовых моделей торговли валютой.

Данные о настроениях должны быть в темах твиттера, включая ключевое слово, например "EUR.USD". И я отфильтрую некоторые сентиментальные слова, чтобы определить их. Простая идея Затем мы пытаемся выяснить, существует ли здесь какая-либо связь между степенью настроения и движением EUR.USD.

Моя большая проблема связана с данными в твиттере Как все мы знаем, что твиттер установил лимит для просмотра данных истории. Вы можете просматривать браузер только в течение 5 дней. Этого недостаточно, поскольку наша стратегия основана на ежедневных настроениях.

Я заметил, что у Google есть какая-то фантастическая вещь, как временная шкала об обновлениях в твиттере: http://www.readwriteweb.com/archives/googles_twitter_timeline_lets_you_explore_the_past.php

Но, во-первых, я нахожусь в Швейцарии и, похоже, у меня нет такой функции в моем Google, которая слишком умна, чтобы определить мое местоположение, и может блокировать некоторые функции версии Google для США, подобные этой. Во-вторых, даже я мог видеть какой-то необычный интерактивный элемент управления временной шкалой Google на моем Firefox. Как я мог вытащить данные из моего запроса и сохранить их? Гугл поставляет такие api?

1 Ответ

2 голосов
/ 18 октября 2011

Служба Google, которую вы упомянули, недавно закрылась, поэтому вы не сможете ее использовать.(http://www.searchenginejournal.com/google-realtime-shuts-down-as-twitter-deal-expires/31007/)

Если вам требуется более длительный период времени для анализа данных, я вижу следующие варианты:

  • оплата исторических данных :) (https://dev.twitter.com/docs/twitter-data-providers)
  • если вы не хотите платить, вам нужно получить твиты, содержащие EUR / USD, что угодно (вы можете использовать потоковый API для этого) и как-то их сохранить. Запустите этот сервис на некоторое время (если это возможно), и выиметь более 5 дней данных.
...