Могу ли я получить более 3200 твитов от пользователя с "rtweet"? - PullRequest
0 голосов
/ 29 апреля 2019

Я использую функцию rtweet get_timeline для загрузки твитов.Тем не менее, некоторые из пользователей, которые меня интересуют, имеют больше, чем 3200 твитов, которые вам разрешено загружать (у некоторых их около 47'000).Существует аргумент «retryonratelimit», если вы загружаете твиты, основанные на словах или хэштегах, поэтому мне интересно, есть ли подобный способ получить более 3200 твитов от одного пользователя?

1 Ответ

0 голосов
/ 29 апреля 2019

Документация - см. ?get_timeline - содержит ссылку на документацию для разработчиков Twitter для GET statuses / user_timeline . Функция R - просто оболочка для этого.

Если вы перейдете по ссылке на Работа с временными шкалами , вы найдете объяснение max_id parameter.

Основной подход тогда:

  1. получите первые 3200 твитов
  2. получить самый ранний идентификатор статуса, используя что-то вроде min(as.numeric(zanetti$status_id))
  3. запустить get_timeline снова, установив max_id = ID, где ID - это идентификатор шага 2

Примечание: я только что попробовал это, используя свою собственную временную шкалу, и к шагу 3 было возвращено только 40 твитов. Поэтому вам, возможно, придется подождать подходящее количество времени, чтобы избежать ограничений по ставке. И помните, что Twitter в основном делает все возможное, чтобы помешать вам запрашивать большие объемы данных через API - в конце концов, то, что вы хотите, может оказаться невозможным.

...