Разница в создании свойств таблицы в улье при использовании ORC serde - PullRequest
0 голосов
/ 24 сентября 2018

Ниже приведена структура одной из существующих таблиц улья.

CREATE TABLE `tablename`(
col1 datatype,
col2 datatype,
col3 datatype)
partitioned by (col3 datatype)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
WITH SERDEPROPERTIES (
  'field.delim'='T',
  'serialization.format'='T')
STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION
  'maprfs:/file/location'
TBLPROPERTIES (
  'COLUMN_STATS_ACCURATE'='{\"BASIC_STATS\":\"true\"}',
  'numFiles'='0',
  'numRows'='0',
  'rawDataSize'='0',
  'totalSize'='0',
  'transient_lastDdlTime'='1536752440')

Теперь я хочу создать таблицу с такими же свойствами, как я могу определить свойства ниже в синтаксисе создания таблицы.

разделитель полей и формат разделения TBLPROPERTIES для хранения numFiles, numRows, radDataSize, totalSize (и всей остальной информации, которую мы можем сохранить в параметре TBLPROPERTIES)

Ниже приведен один из синтаксисов создания таблицыкоторые я использовал

 create table test_orc_load (a int, b int) partitioned by (c int) stored as ORC;

Свойства таблицы, которые я получил, используя опцию show create table.

CREATE TABLE `test_orc_load`(
  `a` int,
  `b` int)
PARTITIONED BY (
  `c` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION
  'maprfs:/user/hive/warehouse/alb_supply_chain.db/test_orc_load'
TBLPROPERTIES (
  'transient_lastDdlTime'='1537774167')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...