Для исследовательского проекта я собираю твиты с помощью Python-Twitter. Однако при непрерывной работе нашей программы на одном компьютере в течение недели нам удается собирать только около 20 МБ данных в неделю. Я запускаю эту программу только на одном компьютере, чтобы мы не собирали одни и те же твиты дважды.
Наша программа запускает цикл, который вызывает getPublicTimeline () каждые 60 секунд. Я попытался улучшить это, вызвав getUserTimeline () для некоторых пользователей, которые появились в общедоступной временной шкале. Тем не менее, это постоянно лишало меня возможности собирать твиты примерно на полчаса каждый раз. Даже без запрета казалось, что добавление этого кода ускорилось очень мало.
Я знаю о «белом списке» Twitter, который позволяет пользователю отправлять больше запросов в час. Я подал заявку на это около трех недель назад, и с тех пор не получаю ответа, поэтому я ищу альтернативы, которые позволят нашей программе более эффективно собирать твиты, не превышая стандартную норму. Кто-нибудь знает более быстрый способ сбора публичных твитов из Twitter? Мы хотели бы получить около 100 МБ в неделю.
Спасибо.