Невозможно увидеть данные таблицы кустов (сохраненные в формате файла Parquet) в CLI - PullRequest
0 голосов
/ 07 мая 2019

Я сохранил таблицу кустов в формате Parquet и успешно загрузил в нее локальные данные.При выполнении операции select на столе я получаю эту ошибку:

Failed with exception java.io.IOException:java.lang.RuntimeException: hdfs://localhost.localdomain:9000/user/hive/warehouse/practice.db/studentam/studarray is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [48, 48, 54, 10]
Time taken: 0.434 seconds


create table studentAM(id int,name string,subject array<string>,mark map<string,int>,year int) row format delimited fields terminated by ',' collection items terminated by '#' map keys terminated by '$' lines terminated by '\n' stored as parquet;

file content:

1,subhash,math#eng#science,math$67#eng$60#science$85,2006
2,kundan,geo#social#pol,geo$79#social$70#pol$81,2007
3,sakesh,eng#math,eng$89#math$75,2006

load data local inpath 'studarray' into table studentam;

1 Ответ

1 голос
/ 07 мая 2019

Шаг 1: Создать text_table с похожими столбцами

Шаг 2. Загрузка данных в text_table

Шаг 3: Вставить данные в parquet_table из text_table.

  insert into Parquet_table as select * from text_table;
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...