Колонка даты / времени куста - PullRequest
0 голосов
/ 25 сентября 2018

У меня есть некоторые данные о HDFS, которые я пытаюсь настроить для запроса через куст.Данные представлены в виде разделенных запятыми текстовых файлов.Один из столбцов в файле - это столбец даты / времени:

Wed Aug 29 16:16:58 CDT 2018

Когда я пытаюсь прочитать таблицу Hive, созданную с помощью следующего сценария, я получаю NULL в качестве значения, читаемого для этого столбца...

use test_db;
drop table ORDERS;

create external table ORDERS(
    SAMPLE_DT_TM TIMESTAMP
    ...
)
row format delimited
fields terminated by ',' 
stored as textfile
location '/user/data';

Когда я заменяю TIMESTAMP на STRING, я могу прочитать значение столбца.Но не уверен, как читать его как подходящий формат даты, поддерживаемый Hive ...

1 Ответ

0 голосов
/ 25 сентября 2018

В Hive 1.2 вы можете установить формат даты следующим образом.

ALTER TABLE ORDERS SET SERDEPROPERTIES ("timestamp.formats"="EEE MMM dd HH:mm:ss zzz yyyy");

Из документов.

На уровне таблицы могут поддерживаться альтернативные форматы меток времени, предоставляя формат для свойства SerDe "timestamp.formats" (начиная с версии 1.2.0 с HIVE-9298).Например, гггг-ММ-дд'ТХЧ: мм: сс.ССС, гггг-ММ-дд'Т'ХЧ: мм: сс.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...