У меня есть требование, когда мне нужно показывать элементы массива в новых строках, но в одной и той же ячейке данных.
Я использую функцию collect_list для сгруппированных данных, чтобы элементы данных сохранялись в список. - ['a', 'b', 'c']
Однако существует требование отображать данные как один элемент в строке, но все элементы в одной ячейке информационного кадра.
Я объяснил требования «КАК ЕСТЬ» и «БЫТЬ» в графическом виде в приведенной ниже ссылке на изображение (извините, прямо сейчас я не могу копировать вставленные изображения непосредственно здесь.)
https://i.stack.imgur.com/BbLgv.png
Мы можем назвать это функциональностью обтекания ячеек, аналогичной Excel, но кто-нибудь знает, как это сделать в pyspark?
Спасибо