Tweepy API - возможно ли анализировать только определенный набор твитов? - PullRequest
0 голосов
/ 22 января 2019

В настоящее время я создаю инструмент, который анализирует временную шкалу одного пользователя в Tweepy. Это цикл for, который выполняет работу с объектом Cursor.

for status in tweepy.Cursor(self.api.user_timeline,screen_name=self.user, tweet_mode="extended",
                            include_rts=False,include_entities=True).items():

Однако анализ пользовательской временной шкалы может занять значительное время, особенно если у них много твитов. Мне интересно, возможно ли проанализировать только определенную часть временной шкалы, то есть между 20-м и 40-м твитами. Я просмотрел документацию по Курсору и не смог ничего найти.

Я тоже попробовал это: для статуса в

tweepy.Cursor(self.api.user_timeline,screen_name=self.user, tweet_mode="extended",
                                    include_rts=True,include_entities=True).items():
            if r>=count and r<=max:
            Do operations here

Но это не сократило время, которое потребовалось.

1 Ответ

0 голосов
/ 23 января 2019

Курсор - это просто удобная оболочка для реального интерфейса подкачки. Из документов :

page = 1
while True:
    statuses = api.user_timeline(page=page)
    if statuses:
        for status in statuses:
            # process status here
            process_status(status)
    else:
        # All done
        break
    page += 1  # next page

При этом вы можете вручную запустить страницу с соответствующим значением и остановить ее после точки.

Я проверил исходный код для Cursor, и, хотя там может быть возможность вставить туда начальную / конечную страницу, это, вероятно, проще.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...