Используя python библиотеку твиттера, как я могу извлечь список пользователей, которые следуют за определенным анонимным #hashtags? - PullRequest
0 голосов
/ 19 апреля 2020

Итак, у меня есть формулировка проблемы, в которой я хочу извлечь список пользователей, которые следят за определенным #hashtag, таким как #obama, #corona et c.

Задача здесь Я хочу извлечь эти данные анонимно, т.е. без предоставления ключей учетной записи.

Я попробовал библиотеку с именем twint, которая способна сделать это, но она очень медленная. Кто-нибудь может порекомендовать лучшую альтернативу для моего случая использования?

Ответы [ 4 ]

2 голосов
/ 29 апреля 2020

Это Github репо, которое я нашел, может быть полезным. Для получения данных из твиттера не требуется аутентификация. Посмотрите на это - https://github.com/bisguzar/twitter-scraper

2 голосов
/ 29 апреля 2020

Я попробовал этот подход в прошлом году, но обнаружил, что мой диапазон дат выходит далеко за пределы доступной информации, предоставленной Twitter, и мне пришлось использовать Premium API. Если это не является для вас ограничением и если вы не хотите кодировать свой собственный скребок, взгляните на эту опцию:

TweetScraper : обновлено в сентябре прошлого года, также предоставляет MongoDB интеграция. Я не пробовал, но, кажется, работает хорошо. Не знаю о времени исполнения.

2 голосов
/ 24 апреля 2020

Вы можете попытаться сделать сценарии в python, используя селен, и я думаю, что вы могли бы получить эти имена пользователей очень быстро.

1 голос
/ 30 апреля 2020

нет такой библиотеки, которая бы соответствовала вашему варианту использования. да, есть эта библиотека twint, но, как вы упомянули, она медленная для вашего варианта использования. так что попробуйте с другими языковыми библиотеками посмотреть, есть ли что-то там.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...