Прочитайте ваш входной файл:
val rdd = sc.textFile('your_file_path')
Затем используйте подстроку для разделения полей и затем преобразуйте RDD в Dataframe, используя toDF ().
val df = rdd.map(l => (l.substring(0, 6).trim(), l.substring(6, 16).trim()))
.toDF("Name","State")
df.show(false)
Результат:
+------+----------+
|Name |State |
+------+----------+
|John |OHIO |
|Victor|NEWYORK |
|Ron |CALIFORNIA|
+------+----------+