У меня есть фрейм данных, который я создал с помощью объекта Pipeline, который выглядит следующим образом:
df.show()
+--------------------+-----+
| features|label|
+--------------------+-----+
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
|[-0.0775219322931...| 0|
+--------------------+-----+
Я успешно извлек векторы объектов, как это:
df_table = df.rdd.map(lambda x: [float(y) for y in x['features']]).toDF(cols)
Проблема с выше, что он не сохраняет столбец метки. В качестве обходного пути я успешно использовал Join, чтобы вернуть столбец метки обратно, но я обнаружил, что он слишком запутанный.
Как бы я использовал однострочник, такой как приведенный выше, для извлечения вектора объектов и создания Вывести из него DF и одновременно добавить к нему и этот столбец меток?