Пример данных DF со столбцом массива:
+--------------------+
| COL1 |
+--------------------+
|[A, B, C] |
+--------------------+
Я пытался использовать array_repeat , но мой тип данных уже имеет ArrayType
df.select(array_repeat(df.COL1, 2).alias('C')).collect()
Вывод:
+----------------------+
| C |
+----------------------+
|[[A, B, C],[A, B, C]] |
+----------------------+
Создан массив массивов
C: array (nullable = false)
| |-- element: array (containsNull = true)
| | |-- element: string (containsNull = false)
Ожидаемый результат:
+----------------------+
| C |
+----------------------+
|[A, B, C, A, B, C] |
+----------------------+