Я новичок в Spark.Пожалуйста, помогите мне с решением.
CSV-файл содержит текст в виде ключ: значение сравнения, разделенные запятой.А в некоторых строках ключи (или столбцы) могут отсутствовать.
Я загрузил этот файл в один столбец кадра данных.Я хочу отделить эти ключи как столбцы и значения, связанные с ним, как данные в этом столбце.И когда пропущены некоторые столбцы, я хочу добавить к этому новый столбец и фиктивные данные.
Фрейм данных
+----------------------------------------------------------------+
| _c0 |
+----------------------------------------------------------------+
|name:Pradnya,IP:100.0.0.4, college: SDM, year:2018 |
|name:Ram, IP:100.10.10.5, college: BVB, semester:IV, year:2018 |
+----------------------------------------------------------------+
Я хочу вывод в этой форме
+----------- ----------------------------------------------
| name | IP | College | Semester | year |
+-----------+-------------------------+-----------+-------+
| Pradnya |100.0.0.4 | SDM | null | 2018 |
+-----------+-------------+-----------+-----------+-------+
| Ram | 100.10.10.5 | BVB | IV |2018 |
+-----------+-------------+-----------+-----------+-------+
Спасибо.