Я пытаюсь вставить данные CSV в базу данных Hive. для этой цели
я пробовал с
listFile --> FetchFile --> ConvertCSVToAvro --> ConvertAvroToOrc --> PutHDFS
CSV-данные преобразуются в формат ORC, а данные загружаются в HDFS. Помимо данных HDFS я могу создать внешнюю таблицу улья.
Теперь я хочу протестировать с putHiveQL
Процессором.
для этого мне нужно преобразовать данные CSV в AVRO в JSON?
Данные ORC не могут быть загружены непосредственно в Hive?
если да, мы должны создать таблицу Hive вручную или она будет создана автоматически?