Функция массива pyspark.sql.functions.array(*cols)
поддерживает порядок при создании массива из cols
?
Например, если мой массив данных равен
+----+----+----+
|col1|col2|col3|
+----+----+----+
| 1| 2| 3|
| 2| 4| 6|
| 7| 2| 4|
+----+----+----+
Должен ли я всегда ожидать, что он сохраняет порядок в массиве вывода?
df.withColumn('col4', F.array('col1', 'col2', 'col3')).show()
+----+----+----+---------+
|col1|col2|col3| col4|
+----+----+----+---------+
| 1| 2| 3|[1, 2, 3]|
| 2| 4| 6|[2, 4, 6]|
| 7| 2| 4|[7, 2, 4]|
+----+----+----+---------+
Или это может изменить порядок вывода cols
в выводе?