получение всех прошлых твитов от домашней хроники пользователей в твиттере - PullRequest
1 голос
/ 21 мая 2011

Я пытаюсь написать программу, которая будет извлекать все твиты, которые пользователь видел на своей временной шкале в Твиттере (то есть от людей, которых они подписали, как они увидят на twitter.com).Я понимаю, что это много данных, а остальные API имеют ограничения.

Каков будет лучший способ сделать это?Медленно извлекайте последние 200 или что-то еще, как ограничено твитами, имея в виду лимит 350 запросов в час?Или есть какой-то жесткий предел того, как далеко я могу пойти даже с этим?

Потоковый API, по-моему, только потоков с текущей точки, поэтому я не думаю, что это вариант.Это личный проект, поэтому я не могу заплатить очень много за любой повышенный доступ или что-нибудь еще.

1 Ответ

3 голосов
/ 21 мая 2011

Да, есть предел того, как далеко вы можете пойти назад:

Клиенты могут получить доступ к теоретическим максимум 3200 статусов через страницу и посчитать параметры для user_timeline методы REST API. Другой Методы временной шкалы имеют теоретическое максимум 800 статусов. Запросы для более чем предел приведет к ответ с кодом состояния 200 и пустой результат в запрошенном формате. Twitter по-прежнему поддерживает базу данных все твиты, отправленные пользователем. Тем не менее, для обеспечения производительности сайт, этот искусственный предел временно на месте.

Источник: http://dev.twitter.com/pages/every_developer

Как вы упомянули, вам нужно будет постранично просматривать каждый из 200 максимальных результатов, которые возвращаются до тех пор, пока вы не достигнете этого предела, и получить пустой набор результатов, стараясь не выполнять 350 запросов в час. Также могут быть пробелы в зависимости от того, сколько твитов есть у пользователя на временной шкале.

...