Документация - см. ?get_timeline
- содержит ссылку на документацию для разработчиков Twitter для GET statuses / user_timeline
. Функция R - просто оболочка для этого.
Если вы перейдете по ссылке на Работа с временными шкалами , вы найдете объяснение max_id parameter
.
Основной подход тогда:
- получите первые 3200 твитов
- получить самый ранний идентификатор статуса, используя что-то вроде
min(as.numeric(zanetti$status_id))
- запустить
get_timeline
снова, установив max_id = ID
, где ID - это идентификатор шага 2
Примечание: я только что попробовал это, используя свою собственную временную шкалу, и к шагу 3 было возвращено только 40 твитов. Поэтому вам, возможно, придется подождать подходящее количество времени, чтобы избежать ограничений по ставке. И помните, что Twitter в основном делает все возможное, чтобы помешать вам запрашивать большие объемы данных через API - в конце концов, то, что вы хотите, может оказаться невозможным.