У меня есть пример данных, как показано ниже:
id,log,code,sequence
100,sample <(>&<)> O sample ? PILE UP - 3 sample,20,7^M$
101,sample- 4/52$
sample$
CM,21,7^M$
102,sample AT 3PM,22,4^M$
Во второй строке (id = 101) в столбце журнала есть символы новой строки, составляющие 3 строки из одной строки.
Я включил опцию ": set list" в редакторе vim для отображения символов новой строки ($) и конца строки (^ M).
Для обработки символов новой строки AWS Рекомендуется OpenCSVSerde здесь .
Я пытался использовать сериализацию OPENCSVSerde с escapeChar=\\, quoteChar=\", seperatorChar=
,
Тем не менее, он показывает данные в виде 5 строк, где мне нужно три строки.
Когда я делаю запрос в Афине, id = 101 показывает только первую строку, а остальные отсутствуют:
id,log,code,sequence
101,sample- 4/52
Какие-либо советы или пример о том, как обрабатывать многострочные символы в столбце файла CSV?
Я изучаю пользовательские классификаторы, но пока не повезло.