Как я могу создать секционированную таблицу, разделенную точкой с запятой и запятой в виде десятичных точек? - PullRequest
0 голосов
/ 05 декабря 2018

У меня проблемы с этим типом таблицы:

    manager;    sales
    charles;    100,1
    ferdand;    212,6
    aldalbert;  23,4
    chuck;      41,6

Я использую приведенный ниже код для создания и определения секционированной таблицы:

    CREATE TABLE db.table
    (
        manager string,
        sales string
        ) 
    partitioned by (file_type string)  
    row format delimited  fields terminated by ';'  
    lines terminated by '\n'  
    tblproperties ("skip.header.line.count"="1");

Впоследствии яЯ использую команду регулярных выражений, чтобы заменить запятые на точки, а затем преобразовать поле sales в числовой тип данных.Интересно, есть ли лучшее решение, чем это?

1 Ответ

0 голосов
/ 06 декабря 2018

Кроме использования Spark или Pig для очистки данных, а также для загрузки таблицы Hive, нет, вам нужно заменить и привести столбец продаж в HiveQL, чтобы получить нужный формат

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...