У меня есть фрейм данных Spark, который придерживается следующей структуры:
+------+-----------+-----------+-----------+------+
|ID | Name1 | Name2 | Name3 | Y |
+------+-----------+-----------+-----------+------+
| 1 | A,1 | B,1 | C,4 | B |
| 2 | D,2 | E,2 | F,8 | D |
| 3 | G,5 | H,2 | I,3 | H |
+------+-----------+-----------+-----------+------+
Для каждой строки, которую я хочу найти, в каком столбце значение Y обозначено как первый элемент.Итак, в идеале я хочу получить список вроде: [Name2,Name1,Name2]
.
Я не уверен, как и работает ли он, чтобы сначала преобразовать в RDD, затем использовать функцию карты и преобразовать результат обратно в DataFrame.
Любые идеи приветствуются.