Необходимо объединить вывод collect_set () в pyspark - PullRequest
0 голосов
/ 01 марта 2019

У меня есть несколько столбцов, которые создаются с использованием collect_set().

Теперь мне нужно создать новый столбец, объединив все эти столбцы.Я не могу этого сделать.Поскольку он показывает тип <Array<string>>.

customer | visit_1_groups| Visit_2_groups|Visit_3_groups |
1   | [[toys]]    |  [[Bikes]]   | [[gloves, helmet]] |
2   | [[Bikes]]   |  [[gloves]]  | [[]]  |

Теперь мне нужно создать новый столбец путем объединения visit_1, visit_2 и visit_3.

.быть как:

[игрушки] [велосипеды] [перчатки, шлем]

[велосипеды] [перчатки]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...