Загрузка данных из CSV-файла в таблицу кустов - PullRequest
0 голосов
/ 04 октября 2018

Я создал таблицу кустов и хочу загрузить в нее данные CSV.Данные содержат несколько символов новой строки в ячейке, поэтому они возвращают нежелательный результат.

Как работать с несколькими символами новой строки в таблице улья?

Я пробовал такой код:

Этот формат используется

Это целые данные одной строки

это результат, который я получаю из запроса

Но ожидаемым результатом была только дата.

CREATE EXTERNAL TABLE db_raw.schoolData
(
     Date string, 
     height string,
     weight string,
     ready_to_make string
)

ROW FORMAT serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
with serdeproperties (
    "separatorChar" = ",",
    "quoteChar"     = "\""

)     
STORED AS TEXTFILE
LOCATION 'bucket path'
tblproperties('skip.header.line.count'='1');

получение данных этого типа в виде выходных данных от

Select Date from schoolData

Выходных данных:

May 15, 2018                                       |
|  '21232514346020300                                |
|  '21232514346020300 '21232514346020300,OD212325143460203000,62029200,

Ожидаемый результат:

May 15, 2018

Ссылался на эту ссылку также, но это не помогло

такая же проблема

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...