как прочитать табличный куст в файле .orc? - PullRequest
0 голосов
/ 16 мая 2018

У меня есть файл .orc, есть ли способ преобразовать его в файл .csv?или есть другой способ прочитать таблицы в этом файле?

1 Ответ

0 голосов
/ 16 мая 2018

Hive имеет встроенную поддержку ORC, поэтому вы можете читать его напрямую через Hive.

Иллюстрация:

(Скажем, файл называется myfile.orc)

Загрузить файл в HDFS

hadoop fs -mkdir hdfs:///my_table_orc_file
hadoop fs -put myfile.orc hdfs:///my_table_orc_file

Создать на нем таблицу Hive

(Обновить определения столбцов, чтобы они соответствовалиданные)

CREATE EXTERNAL TABLE `my_table_orc`(
  `col1` string,
  `col2` string)
STORED AS ORC
LOCATION
  'hdfs:///my_table_orc_file';

Запрос

select * from my_table_orc;
...