У меня есть Dask DataFrame, из которого я хочу сгруппировать столбец и объединить в него список других столбцов.
например: ddf.groupby('group_id')['name', 'department'].agg(list)
ddf.groupby('group_id')['name', 'department'].agg(list)
Есть ли подход, с помощью которого я могу достичь этого?
Используя временные ряды dask в качестве примера, агрегирование столбцов в списки можно выполнить с помощью:
import dask import dask.dataframe as dd import pandas as pd df = dask.datasets.timeseries() name_aggr = df.groupby(["id"])['name'].apply(list, meta=pd.DataFrame).compute()
Спасибо @rpanai за помощь!