Cassandra - это механизм нереляционной базы данных, и если это то, что вам нужно, вы должны сначала оценить Amazon 100 * SimpleDB : механизм нереляционной базы данных, построенный на основе S3.
Если файл нужно обновлять только по времени (ежедневно, ежечасно, ...), тогда это кажется разумным решением. Но вы можете рассмотреть возможность размещения балансировщика нагрузки перед двумя образами EC2, на каждом из которых выполняется копия вашего приложения. Это облегчит масштабирование позже и станет безопаснее, если произойдет сбой одного экземпляра.
Некоторые другие услуги, о которых вы должны прочитать:
http://aws.amazon.com/elasticloadbalancing/ - решение для балансировки нагрузки Amazons.
http://aws.amazon.com/sqs/ - Используется для передачи сообщений между системами в вашей DA (распределенная архитектура). Например, если вы хотите, чтобы системы, которые создают файл данных, отличались от систем, в которых размещается сайт.
http://aws.amazon.com/autoscaling/ - Позволяет регулировать количество онлайн-экземпляров в зависимости от трафика
Убедитесь, что у вас есть хороший процесс резервного копирования с EC2, часто снимайте ваш диск с ОС и помещайте любые изменчивые данные (например, файлы базы данных) в блок EBS. EC2 не часто выходит из строя, но когда у него нет доступа к оборудованию, и если у вас есть актуальный снимок, вы можете просто запустить новый экземпляр онлайн.