сканировать только метаданные твитов без текста твитов, используя список идентификаторов - PullRequest
0 голосов
/ 22 января 2019

КОНТЕКСТ: у меня есть список идентификаторов твитов и их текстовое содержание, и мне нужно сканировать их метаданные.Тем не менее, мой код сканирует метаданные и текст твита.Поскольку у меня около 100 тысяч идентификаторов твитов, я не хочу тратить время на повторный просмотр текста твитов.

Вопрос: Как я могу адаптировать следующий код, чтобы иметь возможность загружать только метаданные твитов?Я использую tweepy и python 3.6.

def get_tweets_single(twapi, idfilepath):
    #tweet_id = '522778758168580098'
    tw_list = []
    with open(idfilepath,'r') as f1:#A File that Contains tweet IDS
        lines = f1.readlines()
        for line in lines:
            try:
                print(line.rstrip('\n'))
                tweet = twapi.get_status(line.rstrip('\n'))#tweepy function to crawl tweet metadata
                tw_list.append(tweet)
                #tweet = twapi.statuses_lookup(id_=tweet_id,include_entities=True, trim_user=True)
                with open(idjsonFile,'a',encoding='utf-8')as f2:
                    json.dump(tweet._json,f2)
            except tweepy.TweepError as te:
                print('Failed to get tweet ID %s: %s', tweet_id, te.message)

def main(args):
    print('hello')
# connect to twitter
    auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
    auth.set_access_token(OAUTH_TOKEN, OAUTH_TOKEN_SECRET)
    api = tweepy.API(auth)
    get_tweets_single(api, idfilepath)

1 Ответ

0 голосов
/ 23 января 2019

Вы не можете только загружать метаданные о твите.

Глядя на документацию , вы можете исключить информацию о пользователе с помощью trim_user=true - но это единственное, что вы можете удалить.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...