Единственный способ, позволяющий любого размера , - следовать протоколу записи HDFS RPC.Например, hdfs dfs -put
В противном случае webhdfs или шлюз NFS, вероятно, прекратят работу с большими файлами (более нескольких ГБ).
Если вы не используете HDFS, используйте соответствующие библиотеки дляместо хранения.Azure или S3, например,
Лучшим решением, чем загрузка файлов, было бы использование RDMBS или Cassandra для аналитики, а затем использование Sqoop или Spark для параллельного экспорта этих данных в Hadoopмода