Заметьте, я знаю, что это старый вопрос, я просто хочу уравновесить некоторые неправильные представления о стоимости, поскольку я делаю это прямо сейчас в качестве теста.
В отличие от того, что думает DavidB, это не стоит миллионов - даже если бы вы работали на выделенном размещенном оборудовании, у вас было бы меньше пары тысяч в месяц (BTDT, один из моих клиентов работает с кластером из 8 узлов примерно $ 800 / месяц). Тем не менее, вы хотите избежать головной боли при обслуживании, а с Cassandra на EC2 гораздо проще справиться.
Вы можете легко запустить существенное производственное облако на EC2 менее чем за 1000 долларов в месяц, а вы можете заниматься исследованиями и разработками менее чем за 100 долларов в месяц (в прошлом месяце я потратил около 52 долларов на кластер из 10 машин). Я настоятельно рекомендую использовать TurnKey Linux для управления и обеспечения вашей R & D-фермы, поскольку их инструменты позволят вам перенести экземпляры с вашего рабочего стола на практически любую виртуализированную платформу хостинга за несколько минут (и наоборот). Плюс у них действительно гладкая интеграция с EC2.
Что касается действительно серьезных уровней трафика, Пинтрест однажды заявил, что они тратят от 15 до 50 долларов в час в зависимости от нагрузки на сервер, автоматическое масштабирование для удовлетворения потребностей в трафике, см. http://www.theregister.co.uk/2012/04/30/inside_pinterest_virtual_data_center/ для получения подробной информации
Реальные затраты на настройку и управление вашим распределенным экземпляром Cassandra. К счастью, только что для этого NetFlix выпустила массу инструментов управления. Вы можете найти их здесь: https://github.com/netflix - есть также множество интересных видео об использовании AWS компанией NetFlix, в частности о перемещении материалов с Cassandra на S3 - см. Их блог здесь http://techblog.netflix.com/2012/12/videos-of-netflix-talks-at-aws-reinvent.html