Нам нужна система, которая должна хранить огромное количество больших CSV-файлов (1000 файлов, каждый 1 ГБ в день).
И есть какой-то клиент должен подключиться к этой системе и загрузить CSV-файлы
система должна быть отказоустойчивой и масштабируемой ...
Я думаю о кластере Hadoop и запускаю на нем FTP-сервер ...
Подходит ли Hadoop для этого проекта?
Если нет, какая технология подходит?