У меня есть веб-сайт, настроенный на экземпляре EC2, который позволяет пользователям просматривать информацию из 4 своих социальных сетей.
Как только пользователь присоединяется, сайт должен обновлять свою информацию каждую ночь, чтобы показать до-дата и соответствующая информация на следующий день.
Первоначально у нас была задача cron, которая проходила через каждого пользователя и выполняла необходимые вызовы API, а затем сохраняла данные в БД (экземпляр amazon rds).
Эта операция должна занимать от 2 до 30 секунд на человека, что означает, что для ее обновления 1 на 1 потребуется несколько дней.
Я смотрел на MapReduce и хотел бы знать, будет ли этоподходящий вариант для того, что я пытаюсь сделать, но на данный момент я не могу сказать наверняка.
Смогу ли я дать файл .sql в MapReduce со всеми записями, которые я хочу обновить +сценарий, который сообщает MapReduce, что делать с каждой записью и обрабатывать ли их все одновременно?
Если нет, то как лучше всего это сделать?
Спасибо за вашепомогите заранее.