из вашего вопроса я предполагаю, что у вас уже есть ваши данные в формате hdfs.
Таким образом, вам не нужно LOAD DATA
, который перемещает файлы в местоположение куста по умолчанию /user/hive/warehouse
. Вы можете просто определить таблицу с помощью ключевого слова external
, которое оставляет файлы на месте, но создает определение таблицы в метасольве улья. Посмотреть здесь:
Создать таблицу DDL
eg.:
create external table table_name (
id int,
myfields string
)
location '/my/location/in/hdfs';
Обратите внимание, что используемый вами формат может отличаться от используемого по умолчанию (как упомянуто в комментариях JigneshRawal). Вы можете использовать свой собственный разделитель, например, при использовании Sqoop:
row format delimited fields terminated by ','