Spark сгруппированные данные Dataframe - PullRequest
0 голосов
/ 12 мая 2018

Как мне получить ключи сгруппированных spark-dataframe?

И еще вопрос:

Что включает в себя pyspark.sql.group.GroupedData объект?

1 Ответ

0 голосов
/ 12 мая 2018

Как получить ключи сгруппированного спарк-фрейма данных?

Без агрегирования данных и сбора результата это невозможно. Было бы проще просто:

df.select(grouping_columns).distinct()

Что включает в себя объект pyspark.sql.group.GroupedData?

Только план выполнения:

...