Таблица восстановления msck не работает на неразмеченной таблице - проблема конфигурации куста - PullRequest
0 голосов
/ 15 апреля 2019

У меня есть неразмеченная ВНЕШНЯЯ таблица:

CREATE EXTERNAL TABLE `db.tableName`(
  `sid` string,
  `uid` int,
  `t1` timestamp,
  `t2` timestamp)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES (
  'field.delim'=',',
  'serialization.format'=',')
STORED AS INPUTFORMAT
  'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  's3://<db_location>/tableName'
TBLPROPERTIES (
  'serialization.null.format'='',
  'transient_lastDdlTime'='1551121065')

Когда я копирую файл tableName.csv в s3://db_location/tableName/tableName.csv, а затем запускаю msck repair table db.tableName, я возвращаю счет в ноль.В CSV есть 10 строк, и я рассчитываю вернуть счет как 10.

Любая помощь приветствуется.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...