Tweepy не возвращает полный список пользователей - PullRequest
0 голосов
/ 19 июня 2019

Привет, я новичок в python, и я пытаюсь написать этот код, чтобы использовать tweepy для извлечения всех пользователей, которые использовали определенный хэштег.Хэштег очень мал, примерно 30 твитов на данный момент, но когда я запускаю скрипт, он возвращает только 12 имен.Просто любопытно, что если я что-то делаю неправильно, это мешает мне вытащить полный список имен.

consumer_key = ''
consumer_secret = ''
access_token = ''
access_token_secret = ''

auth = tw.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tw.API(auth, wait_on_rate_limit=True)

search_words = "#Testhashtag"
date_since = "2019-06-12"

new_search = search_words

tweets = tw.Cursor(
    api.search,
    q=new_search,
    lang="en",
    since=date_since).items(9999999999)

users_locs = [[tweet.user.screen_name, tweet.created_at] for tweet in 
tweets]

tweet_text = pd.DataFrame(
    data=users_locs,
    columns=['Username', "Date Posted"])

tweet_text.drop_duplicates(
    subset="Username",
    keep='first', inplace=True)

Также было интересно, как включить подсчет всех твитов, используя этот хэштег для проверки, чтобы увидетьесли это общее количество выводимых пользователей.

1 Ответ

0 голосов
/ 19 июня 2019

На основе приведенной ниже ссылки api.search имеет параметр с именем count, который ограничит ваши результаты.

https://github.com/tweepy/tweepy/blob/master/tweepy/api.py

вы можете получить больший результат, установив счетчик, превышающий счет по умолчанию. Так что ваш код будет выглядеть так:

tweets = tw.Cursor(
    api.search,
    q=new_search,
    lang="en",
    count=50,
    since=date_since).items(9999999999)

Дайте мне знать, если это сработало.

...