Можно выполнить итерацию по набору данных в Python, используя фрейм данных Pandas после выполнения операции groupBy
с набором данных, как показано ниже.
xGroup = df.groupby("x")
for name, group in xGroup:
print(name)
print(group)
Как выполнить та же операция в apache -spark java? Когда я наберу groupBy
для набора данных, я получу RelationalGroupedDataSet
, который я не могу перебрать.