Очистка Твиттера для итогов хэстэгов - PullRequest
0 голосов
/ 07 ноября 2019

Итак, я делаю некоторую чистку в Твиттере, и приведенный ниже код даст мне твиттера текстовое имя пользователя и количество подписчиков, но у меня НЕТ ИДЕИ, как получить ХОТАГОВЫЕ ИТОГИ. По сути, я хочу знать, сколько раз использовался хэштег в течение определенного периода времени ИЛИ полная сумма. Я искал по всему и не могу найти его. Это не мой оригинальный код, к которому он был получен здесь . Если бы кто-нибудь мог мне помочь, я бы так это оценил. Спасибо.

def search_for_hashtags(consumer_key, consumer_secret, access_token, access_token_secret, hashtag_phrase):

    auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
    auth.set_access_token(access_token, access_token_secret)

    api = tweepy.API(auth)


    fname = '_'.join(re.findall(r"#(\w+)", hashtag_phrase))


    with open('%s.csv' % (fname), 'wb') as file:

        w = csv.writer(file)


        w.writerow(['timestamp', 'tweet_text', 'username', 'all_hashtags', 'followers_count'])


        for tweet in tweepy.Cursor(api.search, q=hashtag_phrase+' -filter:retweets', \
                                   lang="en", tweet_mode='extended').items(100):
            w.writerow([tweet.created_at, tweet.full_text.replace('\n',' ').encode('utf-8'), tweet.user.screen_name.encode('utf-8'), [e['text'] for e in tweet._json['entities']['hashtags']], tweet.user.followers_count])


        for tweet in tweepy.Cursor(api.search, q=hashtag_phrase+' -filter:retweets', \
                                   lang="en", tweet_mode='extended').items(100):
            w.writerow([tweet.created_at, tweet.full_text.replace('\n',' ').encode('utf-8'), tweet.user.screen_name.encode('utf-8'), [e['text'] for e in tweet._json['entities']['hashtags']], tweet.user.followers_count])

"""I'm using [In] via Jupyter"""
consumer_key = raw_input('Consumer Key ')
consumer_secret = raw_input('Consumer Secret ')
access_token = raw_input('Access Token ')
access_token_secret = raw_input('Access Token Secret ')

hashtag_phrase = raw_input('Hashtag Phrase ')

if __name__ == '__main__':
    search_for_hashtags(consumer_key, consumer_secret, access_token, access_token_secret, hashtag_phrase)
...