С помощью aws сервисов athena я пытаюсь импортировать CSV-файл, включающий данные новой строки
При импорте данных используется формат Hive Serde.
Если данные такие, (все данные прилагаются в двойных кавычках. "")
"DataA" | "DataB" | "Data C"
"Data1" | "Data2
с новой строкой" | "Data3"
"Данные 가" | "Данные2 나" | "Данные 나"
тогда как записать регулярные выражения в таблицу DDL ниже?
CREATE EXTERNAL TABLE ssdm_schema.ABCTable_regex (
Data_A VARCHAR(100)
, Data_B VARCHAR(100)
, Data_C VARCHAR(100)
) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
"input.regex" = '?????????'
)
Я спрашиваю на этот вопрос, ссылаясь на следующий ответ.
Как обрабатывать вставку разрывов строк в AWS Афина
Спасибо