Я хотел бы создать фрейм данных pyspark из матрицы NxM NumPy. Этот фрейм данных должен иметь N строк, но только 1 столбец, содержащий данные массива размером (1xM).
Я пытался преобразовать матрицу NxM Numpy в кадр данных Pandas. Однако исходный размер матрицы велик (1M x 2000) с дальнейшими операциями в нисходящем направлении, и я смогу работать, только если смогу создать фрейм данных pyspark для простой матрицы.
например
Я хотел бы преобразовать приведенную ниже матрицу
m = np.array([[1, 2], [11, 22], [111, 222])
к фрейму данных pyspark, который выглядит как
+-----+----------+
|index| array |
+-----+----------+
| 0| [1, 2]|
| 2| [11, 22]|
| 3|[111, 222]|
+-----+----------+