Основная проблема с майнингом данных в Твиттере - PullRequest
0 голосов
/ 21 февраля 2019

Это моя первая попытка извлечь твиты, используя твиттер api и tweepy.Когда я выполняю свой код, он продолжает печатать 401 каждый раз в новой строке.Что я делаю неправильно, я не могу понять.Любая помощь приветствуется.

import tweepy
import json
access_token = ""
access_token_secret = ""
consumer_key = ""
consumer_secret = ""
auth = tweepy.OAuthHandler(consumer_key,consumer_secret)
auth.set_access_token(access_token,access_token_secret)
class MyStreamListener(tweepy.StreamListener):
    def __init__(self, api=None):
        super(MyStreamListener, self).__init__()
        self.num_tweets = 0
        self.file = open("tweets.txt", "w")

    def on_status(self, status):
        tweet = status._json
        self.file.write( json.dumps(tweet) + '\n' )
        self.num_tweets += 1
        if self.num_tweets < 100:
            return True
        else:
            return False
        self.file.close()

    def on_error(self, status):
        print(status)
l = MyStreamListener()
stream=tweepy.Stream(auth,l)
stream.filter()
tweets_data_path = 'tweets.txt'
tweets_file = open(tweets_data_path, "r")
tweets_data = []
for line in tweets_file:
    tweet = json.loads(line)
    tweets_data.append(tweet)
tweets_file.close()
print(tweets_data[0].keys())

1 Ответ

0 голосов
/ 22 февраля 2019

Перейдите в настройки своей учетной записи в Twitter и измените часовой пояс на ваш компьютер.Затем перейдите в настройки приложения Twitter и сгенерируйте новый потребительский ключ и новый токен доступа.Эти вновь сгенерированные ключи и токены вы должны использовать, чтобы избежать ошибки 401.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...