Объединить массив объектов в pyspark - PullRequest
0 голосов
/ 17 ноября 2018

Рассмотрим следующий DF:

df = spark.createDataFrame(
    [
        Row(
            x='a',
            y=[
                {'f1': 1, 'f2': 2},
                {'f1': 3, 'f2': 4}
            ],
            z=[
                {'f3': 1, 'f4': '2'},
                {'f3': 1, 'f4': '4', 'f5': [1,2,3]}
            ]
        )
    ]
)

Я хочу объединить y и z по индексу, чтобы я мог получить:

[
    Row(x='a', y={'f1': 1, 'f2': 2}, z={'f3': 1, 'f4': 2}), 
    Row(x='a', y={'f1': 3, 'f2': 4}, z={'f3': 1, 'f4': 4, 'f5': [1,2,3]})
]

Как это можно сделать без преобразования вРДД

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...