Один из способов сделать это - загрузить данные со статическим c разделением, в котором вы вручную определяете различные разделы. При разбиении на разделы stati c вы создаете раздел вручную, используя оператор ALTER TABLE… ADD PARTITION, а затем загружаете данные в раздел.
CREATE TABLE customers_by_date
(cust_id STRING, name STRING)
PARTITIONED BY (dt STRING)
STORED AS PARQUET;
ALTER TABLE customers_by_country
ADD PARTITION (dt='2020-06-01')
SET LOCATION '/user/name/folder/dt=2020-06-01';
Если местоположение не указано, то это местоположение создано
ALTER TABLE customers_by_date
ADD PARTITION (dt='2020-06-01');
, и вы также можете загружать данные с помощью команд HDFS
$ hdfs dfs -cp /user/name/folder/dt=2020-06-01 /user/directory_impala/table/partition
Вы можете перейти по этим ссылкам в документации Cloudera для получения дополнительных сведений:
Разделение для таблиц Impala
Оператор создания таблицы Impala
Оператор Impala Alter table