Вы должны опустить предложение ROW FORMAT
и подпункты, определяющие терминаторы, и включить предложение STORED AS
(Parquet - единственный формат, который Impala поддерживает со сложными данными).
Файлы данных для загрузки таблицы также должны быть в формате паркета.
Если у вас нет файла данных в формате Parquet, вы можете создать таблицу в Hive, а затем создать копию, используя CREATE TABLE … AS SELECT
(оператор CTAS), с STORED AS PARQUET
.
Затем вы можете запросить таблицу в Impala.
В качестве примера
-- Create table in Hive
CREATE TABLE array_demo( arra_col ARRAY<STRING>)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '|'
STORED AS TEXTFILE;
-- Copy the table as parquet format
CREATE TABLE array_demo_impala AS
SELECT *
FROM array_demo
STORED AS PARQUET;