Для записи в S3 используйте гем Rightaws, у него действительно хороший интерфейс s3:
http://rightaws.rubyforge.org/right_aws_gem_doc/
Ваш процесс, вероятно, будет выглядеть так:
- Сбор данных
- Запись в некоторый промежуточный элемент на каждом узле
- Отправить файл на S3 (используя уникальную схему именования)
- Повторите
В качестве альтернативы используйте базу данных. Тогда все в том же месте. Вы можете использовать что-то вроде mongodb, потому что это без схемы, но вы все равно можете иметь полезные индексы (например, индекс домена). Это хорошо до миллионов строк.
Если вы поместите материал в s3, это будут просто плоские файлы, поэтому поиск данных на другом конце займет много времени.