Согласно Hive-6384 Jira, Начиная с Hive-1.2 вы можете использовать типы Timestamp,date
в паркетных таблицах.
Обходные пути для Hive <1.2 версии: </strong>
1. Использование типа String:
CREATE EXTERNAL TABLE IF NOT EXISTS dev_db.processing_table
(
campaign STRING,
status STRING,
file_name STRING,
arrival_time STRING
)
PARTITIONED BY (
Date STRING)
Stored as parquet
Location '/mnt/data_analysis/pre-processed/';
Затем при обработке вы можете преобразовать arrival_time
, Date
в типы timestamp
, date
.
Использование a view
и приведите столбцы, но views are slow.
2. Using ORC format:
CREATE EXTERNAL TABLE IF NOT EXISTS dev_db.processing_table
(
campaign STRING,
status STRING,
file_name STRING,
arrival_time Timestamp
)
PARTITIONED BY (
Date date)
Stored as orc
Location '/mnt/data_analysis/pre-processed/';
OR C поддерживает оба типа timestamp
, date