Я пытаюсь загрузить большие CSV-файлы (каждый из ~ 4G) в Hive через Ambari.Процесс CREATE TABLE - LOAD DATA, приведенный ниже, отлично работает для небольших CSV-файлов, но не для таких больших.Он продолжает выдавать ошибку сервера «не удалось получить информацию таблицы».
Используемые в настоящее время коды:
CREATE TABLE my_table(
id int,
text string )
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
и
LOAD DATA INPATH 'mypath/INPUT.csv' OVERWRITE INTO TABLE my_table;
Есть ли лучший способ загрузки больших файлов CSV?
Заранее спасибо