Для хранения данных используйте Hadoop HDFS (файловая система Hadoop)
Если данные только для вставки (структура данных не изменяется), используйте Hive
Используйте Sqoop в качестве соединителя между HDFS и Hive.
Если данные нужно искать (что-то вроде поисковой системы), используйте Solr
Наконец, для ведения данных журнала попробуйте Flume