Я рассматриваю использование HDFS в качестве системы хранения файлов с горизонтальным масштабированием для нашего клиентского видеохостинга. Моя главная проблема в том, что HDFS не была разработана для этих нужд, это скорее «система с открытым исходным кодом, используемая в настоящее время в ситуациях, когда необходимо обрабатывать огромные объемы данных».
Мы не хотим обрабатывать данные, просто сохраняем их, создаем на основе HDFS что-то вроде небольшого внутреннего аналога Amazon S3.
Вероятно, важным моментом является то, что размер хранимого файла будет вполне мерзавцем от 100 МБ до 10 ГБ.
Кто-нибудь использовал HDFS в таких целях?