Вы просто загружаете его в HDFS через API файловой системы
, например hadoop fs -put something.ext /tmp
То же самое относится и к другим блочным хранилищам. Это не действует по-другому. Единственное, что добавляет HDFS, это то, что вам нужно подумать о том, как вы будете анализировать файлы обратно после того, как они будут разделены между датодами