Как разбить строку на столбцы, где символ разделитель и запятая, но этот символ отображается как содержимое полей - PullRequest
0 голосов
/ 06 апреля 2019

Я выполняю загрузку данных, где каждая строка имеет символы "в начале и конце полей и запятую в качестве разделителя, как показано ниже:

"sU92", "eRouter1.0"
"sU92" "," eRouter1.0 "
"sU9.2", "eRouter1.0"

Обратите внимание, что во второй строке есть две двойные кавычки (2 "), а в третьей строке запятая между цифрами 9 и 2 (9,2).

Всякий раз, когда я пытаюсь создать таблицу с разделителем-запятой и с quotechar = '\ "', записи прерываются.

1 Ответ

0 голосов
/ 06 апреля 2019

Создать таблицу без включения кавычек, используйте LasySimpleSerDe (по умолчанию)

create table mytable(
col1 string,
col2 string) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;

Затем снимите кавычки в строках и удалите лишние пробелы в выделении, используя, например, regexp_replace:

trim(regexp_replace(str, '\\"',''))

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...