Эволюция схемы ORC - PullRequest
       51

Эволюция схемы ORC

0 голосов
/ 30 января 2019

Проанализировав сам пример файла ORC, я узнал, что формат файла ORC не хранит никакой информации о столбцах, фактически все имена столбцов будут заменены с _c0 на _cn, в таком случае, как может быть правильное развитие схемыдостигнуто для таблиц ORC?

1 Ответ

0 голосов
/ 31 января 2019

Формат ORC не хранит никакой информации об именах столбцов куста.При создании ORC-файла с использованием PIG произошла ошибка.Вы можете найти детали ниже

https://issues.apache.org/jira/browse/HIVE-7189

Я думаю, что формат файла ORC (и другие) полагаются на Hive Metastore для этой информации.если вы запустите describe formatted <table_name>, вы получите информацию о схеме.

что-то вроде

# col_name              data_type               comment

name                    string
...