Я пытаюсь прочитать CSV-файл в кадре данных, используя кодировщик, но сталкиваюсь с некоторыми проблемами. Файл имеет следующий формат:
![enter image description here](https://i.stack.imgur.com/9uynE.png)
Пока нужно взять первую запись и сделать соответствующую запись:
92,61,2008-08-01T14: 45: 37Z, 90,13, "http://svnbook.red -bean.com /" "> Управление версиями с SubversionА очень хороший ресурс для контроля исходного кода в целом. Не совсем для TortoiseSVN Впрочем.
"
Отсутствует весь второй абзац. Вот что я делаю, чтобы разобрать CSV:
case class tit(Id:Int,OwnerUserId:Int,CreationDate:String,ParentID:Int,Score:Int,Body:String)
val schema=Encoders.product[tit].schema
val df=spark.read.schema(schema).csv(fileName)