Разделение элементов массива pyspark символом новой строки в той же ячейке данных - PullRequest
0 голосов
/ 11 марта 2020

У меня есть требование, когда мне нужно показывать элементы массива в новых строках, но в одной и той же ячейке данных.

Я использую функцию collect_list для сгруппированных данных, чтобы элементы данных сохранялись в список. - ['a', 'b', 'c']

Однако существует требование отображать данные как один элемент в строке, но все элементы в одной ячейке информационного кадра.

Я объяснил требования «КАК ЕСТЬ» и «БЫТЬ» в графическом виде в приведенной ниже ссылке на изображение (извините, прямо сейчас я не могу копировать вставленные изображения непосредственно здесь.)

https://i.stack.imgur.com/BbLgv.png

Мы можем назвать это функциональностью обтекания ячеек, аналогичной Excel, но кто-нибудь знает, как это сделать в pyspark?

Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...