Да, это возможно через Hive
. Вы можете создать внешнюю таблицу и ссылаться на существующее местоположение HDFS
, содержащее файлы gzip
. Схема для данных должна быть указана при создании таблицы.
hive> CREATE EXTERNAL TABLE my_data
(
column_1 int,
column_2 string
)
LOCATION 'hdfs:///my_data_folder_with_gzip_files';