Я строю проект на python, который должен очищать огромные и большие объемы данных Twitter.Примерно 1 миллион пользователей и все их твиты должны быть удалены.
Ранее я использовал Tweepy и Twython, но очень быстро достиг предела Twitter.
Как компании по анализу настроений и т. Д. Получают свои данные?Как они получают все эти твиты?Вы покупаете это где-нибудь или создаете что-то, что проходит через разные прокси или что-то в этом роде?
Как такие компании, как Infochimps, например с Trst, получают все свои данные?* http://www.infochimps.com/datasets/twitter-census-trst-rank