Tweepy потоковое в MongoDB с full_text - PullRequest
0 голосов
/ 17 января 2020

Мне нужна помощь в разработке Python кода, работающего с библиотеками Tweepy и MongoDB. Я не могу транслировать твиты с полным текстом. Я не знаю, как реализовать этот код для этой цели.

Пожалуйста, посмотрите на этот код:

keywords = ['trump']

language = ['en']

analyzer = SentimentIntensityAnalyzer()

class StdOutListener(StreamListener):


    def on_status(self, status):
        if hasattr(self, status):
            try:
                tweet = status.retweted_status.extended_tweet["full_text"]
            except:
                tweet = status.retweeted_status.text
        else:
            try:
                tweet = status.extended_tweet["full_text"]
            except AttributeError:
                tweet = status.text



    def on_data(self, data):

        t = json.loads(data)

        tweet_id = t['id_str']  
        username = t['user']['screen_name']  
        followers = t['user']['followers_count']  


        tweet = unidecode(t['text'])
        text = t['full_text']            
        hashtags = t['entities']['hashtags']  
        dt = t['created_at']  
        language = t['lang']  


        blob = analyzer.polarity_scores(tweet)
        sentiment = blob['compound']


        created = datetime.datetime.strptime(dt, '%a %b %d %H:%M:%S +0000 %Y')

        tweet = {'id':tweet_id, 'username':username, 'followers':followers, 'text':text, 'hashtags':hashtags, 'language':language, 'created':created, 'sentiment':sentiment}

        print (username + ':' + ' ' + text)
        return True

    def on_error(self, status_code):
        if status_code == 420:
            print (status)
            return False


if __name__ == '__main__':
    l = StdOutListener()
    auth = OAuthHandler(consumer_key, consumer_secret)
    auth.set_access_token(access_token, access_token_secret)

    stream = Stream(auth, l, tweet_mode="extended")



    tweets = stream.filter(track=keywords, languages=language )

Я пытался сделать это плохим способом. Например Я заменил текст на full_text, но он не работает. Я надеюсь, что вы можете помочь мне .. Спасибо за ваше время!

1 Ответ

0 голосов
/ 17 января 2020

if hasattr(self, status): повысит TypeError, так как hasattr требует ввода строки для имен атрибутов.

Вам следует обратиться к документации Tweepy по расширенным твитам , у которого пример очень похож на то, что я думаю, вы пытаетесь сделать.

...