У меня есть копия данных RDD из следующего файла, я хочу объединить строки на основе разделителя строк, чтобы я мог получить RDD [Person].
case class Person(id: String, name: String, job: String)
--------------
id : 1
name : amy
job : teacher
--------------
id : 2
name : bob
job : nurse
--------------
id : 3
name : charlie
job : policeman
--------------
Обратите внимание, что файл данных огромен и не может поместиться в памяти, поэтому вы не можете сделать что-то вроде
val lines = sc.textFile("/path/to/file")
val person = lines.collect...
Кто-нибудь может помочь?