CSV-серверу, которому не удалось выйти из значений, в искровом фрейме данных «\» содержится «*».
Считывание данных CSV-файла с использованием искрового CSV-файла, но ему не удалось экранировать символ «\».
spark.read.option ("multiLine", "true"). Option ("delimiter", '|'). Csv ("/ data / working / dev01 / textfile /")
Фактический результат
_c1 |_c2 | c3 |
---- + -------------- +
10 | "viv" | "1"| 10 |
10 |" viv "|" 1 "| 10 |
10 |" viv "|" 1 "| 10 |
10 |" viv"|" 1 "| 10 |
---- + -------------- +
Ожидаемый результат
" 10"|" viv \ "|" 1 "|" 10 "|
" 10 "|" viv \ "|" 1 "|" 10 "|
" 10 "|" viv\ "|" 1 "|" 10 "|
" 10 "|" viv \ "|" 1 "|" 10 "|
Из-за" \ "происходит слияние двух столбцовзначения в один столбец. В приведенном выше примере «viv» | 1 объединены в 1 столбец как _c2, на самом деле это должно быть