Как я уже описывал в комментарии, когда у вас есть фиксированное количество столбцов, которое вы знаете заранее, вы можете просто объединить значения в новом столбце с withColumn
, а если вам нужен массив, вы можете использовать array
df1= sqlContext.createDataFrame([("06:37:14", '2', '3', '4', '5')], ['Time', 'A', 'B', 'C', 'D'])
df1.withColumn("Features", array("A","B","C","D")).drop("A","B","C","D").show(truncate=False)
Выход:
+--------+------------+
|Time |Features |
+--------+------------+
|06:37:14|[2, 3, 4, 5]|
+--------+------------+