Я недавно начал использовать scala spark, в частности, я пытаюсь использовать GraphX для создания графика из CSV.Чтобы прочитать CSV-файл с искровым контекстом, я всегда делаю это:
val rdd = sc.textFile("file/path")
.map(line => line.split(","))
Таким образом, я получаю СДР объектов Array [String].Моя проблема состоит в том, что файл csv содержит строки, разделенные кавычками ("") и числом без кавычек, пример некоторых строк внутри файла следующий:
"Luke",32,"Rome"
"Mary",43,"London"
"Mario",33,"Berlin"
Если я использую метод split (", ") Я получаю объекты String, которые внутри содержат кавычки, например, строка Luke сохраняется как" Luke ", а не как Luke.Как я могу сделать, чтобы не учитывать кавычки и сделать правильные строковые объекты?Я надеюсь, что мне было ясно объяснить мою проблему