Я создал таблицу кустов и хочу загрузить в нее данные CSV.Данные содержат несколько символов новой строки в ячейке, поэтому они возвращают нежелательный результат.
Как работать с несколькими символами новой строки в таблице улья?
Я пробовал такой код:
Этот формат используется
Это целые данные одной строки
это результат, который я получаю из запроса
Но ожидаемым результатом была только дата.
CREATE EXTERNAL TABLE db_raw.schoolData
(
Date string,
height string,
weight string,
ready_to_make string
)
ROW FORMAT serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
with serdeproperties (
"separatorChar" = ",",
"quoteChar" = "\""
)
STORED AS TEXTFILE
LOCATION 'bucket path'
tblproperties('skip.header.line.count'='1');
получение данных этого типа в виде выходных данных от
Select Date from schoolData
Выходных данных:
May 15, 2018 |
| '21232514346020300 |
| '21232514346020300 '21232514346020300,OD212325143460203000,62029200,
Ожидаемый результат:
May 15, 2018
Ссылался на эту ссылку также, но это не помогло
такая же проблема