У меня есть следующий столбец в фрейме данных pyspark типа Array [Int].
+--------------------+
| feature_indices|
+--------------------+
| [0]|
|[0, 1, 4, 10, 11,...|
| [0, 1, 2]|
| [1]|
| [0]|
+--------------------+
Я пытаюсь заполнить массив нулями, а затем ограничить длину списка, чтобы длинамассива каждой строки будет одинаковым.Например, для n = 5 я ожидаю:
+--------------------+
| feature_indices|
+--------------------+
| [0, 0, 0, 0, 0]|
| [0, 1, 4, 10, 11]|
| [0, 1, 2, 0, 0]|
| [1, 0, 0, 0, 0]|
| [0, 0, 0, 0, 0]|
+--------------------+
Есть предложения?Я посмотрел на функцию pyspark rpad
, но она работает только со столбцами строкового типа.