Я делаю collect_list для фрейма данных, который дает мне требуемый column(TASourceId)
, как показано ниже:
[{"TASourceId": "Source1", "flag": "true"}, {"TASourceId": "Source2", "flag": "true"}]
Запрос:
SELECT col1, col2,col3, collect_list(struct(TASourceId, flag)) as TASourceId
FROM table
GROUP BY 1,2,3
Возможно ли чтобы получить словарь объектов словаря в качестве вывода столбца, например:
{"col1":{"TASourceId": "Source1", "flag": "true"}, "col2":{"TASourceId": "Source2", "flag": "true"}}
Я пытаюсь использовать spark UDF
, чтобы получить это, но получаю следующую ошибку:
Ожидаемые нулевые аргументы для ошибки class dict.