У меня есть пустой массив в pyspark, и я хотел бы преобразовать его в DataFrame, чтобы я мог записать его как CSV для просмотра.
Я считал данные изначально из DataFrame, однако япришлось преобразовать в массив, чтобы использовать numpy.random.normal()
.Теперь я хочу преобразовать данные обратно, чтобы я мог записать их как csv для просмотра.
Я попробовал следующее непосредственно в массиве
zarr.write.csv("/mylocation/inHDFS")
, однако я получаю следующееошибка
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'numpy.ndarray' object has no attribute 'write'
Есть идеи?