Если вы не Facebook или Amazon, у вас нет реальной причины использовать что-то столь сложное, как Hadoop или Cassandra.Когда вы достигнете этого уровня роста, вы сможете позволить себе инженеров, которые смогут выбрать / спроектировать идеальное решение ваших проблем.
А пока я настоятельно рекомендую GlusterFS для распределенного хранилища.Его чрезвычайно легко установить, настроить, запустить и запустить.Кроме того, если вы в настоящее время транслируете файлы из локального хранилища, вы поймете, что GlusterFS также действует как локальное хранилище, оставаясь доступным для нескольких серверов.Другими словами, никаких изменений в вашем приложении не требуется.
Я не могу сказать вам точные параметры конфигурации для вашего конкретного приложения, но есть много доступных, таких как распределенные, реплицированные, чередующиеся данные.Вы также можете поиграть с настройками кэша, чтобы избежать попадания дисков при каждом запросе и т. Д.
Одна вещь, на которую следует обратить внимание, поскольку GlusterFS находится на уровне выше других уровней хранения (особенно в Amazon), вы можете не получить впечатляющий дискспектакль.На самом деле, это может быть намного хуже, чем у вас сейчас, ради масштабируемости ... в основном вы могли бы лучше проектировать свое приложение для обслуживания потокового мультимедиа из CDN, который уже имеет инфраструктуру, подходящую для вашего типа приложений.Об этом стоит подумать.