PutHiveStreaming ожидает, что файлы входящего потока будут в формате Avro.Если вы используете PutHive3Streaming, у вас больше гибкости, но он не принимает потоковые файлы в формате ORC;вместо этого оба этих процессора преобразуют ввод в ORC и записывают его в управляемую таблицу в Hive.
Если ваши файлы уже имеют формат ORC, вы можете использовать PutHDFS, чтобы поместить их непосредственно в HDFS.Если у вас нет прав на запись непосредственно в местоположение управляемой таблицы, вы можете выполнить запись во временную папку, создать поверх нее внешнюю таблицу и затем загрузить ее в управляемую таблицу, используя INSERT INTO myTable FROM SELECT * FROM externalTable
или что-то еще.