У меня есть CSV-файл, как показано ниже
В нем 6 строк с верхней строкой в качестве заголовка, в то время как заголовок, читаемый как метка «Студент отмечает», обрабатывает их как один столбец, теперь я хочу разделить оба столбцас данными.«ученик» и «отметки» разделены пробелом.
df.show()
_______________
##Student Marks##
---------------
A 10;20;10;20
A 20;20;30;10
B 10;10;10;10
B 20;20;20;10
B 30;30;30;20
Теперь я хочу преобразовать эту таблицу CSV в два столбца, со студентом и отметками, также для каждого ученика отметки с суммированием, что-то вродениже
Student | Marks
A | 30;40;40;30
B | 60;60;60;40
Я пробовал ниже, но выдает ошибку
df.withColumn("_tmp", split($"Students Marks","\\ ")).select($"_tmp".getItem(0).as("col1"),$"_tmp".getItem(1).as("col2")).drop("_tmp")