Hive имеет встроенную поддержку ORC
, поэтому вы можете читать его напрямую через Hive.
Иллюстрация:
(Скажем, файл называется myfile.orc
)
Загрузить файл в HDFS
hadoop fs -mkdir hdfs:///my_table_orc_file
hadoop fs -put myfile.orc hdfs:///my_table_orc_file
Создать на нем таблицу Hive
(Обновить определения столбцов, чтобы они соответствовалиданные)
CREATE EXTERNAL TABLE `my_table_orc`(
`col1` string,
`col2` string)
STORED AS ORC
LOCATION
'hdfs:///my_table_orc_file';
Запрос
select * from my_table_orc;