У меня есть фрейм данных PySpark со столбцом, который содержит значения, разделенные запятыми. Количество значений, содержащихся в столбце, является фиксированным (скажем, 4). Пример:
+------------------------+
|col1 |
+------------------------+
|1,val1, val4 |
|2,val1 |
|3,val1, val2, val3 |
|4,val1, val2, val3, val4|
+------------------------+
Теперь я хочу, чтобы он был разбит на 2 столбца, как показано ниже
+----+------------------------+
|col1|col2 |
+----+------------------------+
| 1|[val1, val4] |
| 2|[val1] |
| 3|[val1, val2, val3] |
| 4|[val1, val2, val3, val4]|
+----+------------------------+
Как это можно сделать?