Я храню большое количество данных в Твиттере и хотел бы получить около 500 тыс. Записей для обработки данных за раз.У меня есть документ TwitterTweet mongo, содержащий основные данные твитов, и я пытаюсь получить его следующим образом:
weekly_tweets = TwitterTweet.all(:created_at.gt => 1.week.ago, :fields => [:created_at, :text, :from_user])
Проблема в том, что это занимает много времени и памяти - естьлюбой способ сделать это более масштабируемым и эффективным.Я думал об использовании карты, но это выглядит очень сложно для того, что я хочу сделать - обработка текста и регулярные выражения в твитах.