Как сгруппировать столбец и объединить в виде списка другой столбец в Dask DataFrame? - PullRequest
0 голосов
/ 06 июня 2019

У меня есть Dask DataFrame, из которого я хочу сгруппировать столбец и объединить в него список других столбцов.

например: ddf.groupby('group_id')['name', 'department'].agg(list)

Есть ли подход, с помощью которого я могу достичь этого?

1 Ответ

1 голос
/ 10 июня 2019

Используя временные ряды dask в качестве примера, агрегирование столбцов в списки можно выполнить с помощью:

import dask
import dask.dataframe as dd
import pandas as pd
df = dask.datasets.timeseries()
name_aggr = df.groupby(["id"])['name'].apply(list, meta=pd.DataFrame).compute()

Спасибо @rpanai за помощь!

...