Можно ли запустить агрегацию на всем фрейме данных dask (без использования groupby)? - PullRequest
1 голос
/ 19 апреля 2020

Pandas dataframe предлагает метод aggregate / agg для агрегирования по всем или подмножеству столбцов.

df = pd.DataFrame(
             [
                 ("1", 1, 0, 0),
                 ("2", 2, 0, 0),
                 ("3", 3, 0, 0),
                 ("4", 4, 5, 4),
                 ("5", 5, 6, 6),
                 ("6", 6, 7, 7),
           ],
    columns=("item", "att1", "att2", "att3"),
)

df.agg(["mean", "max", "sum"]) # ->
#        item  att1  att2       att3
# mean   20576   3.5   3.0   2.833333
# max        6   6.0   7.0   7.000000
# sum   123456  21.0  18.0  17.000000

Однако кадры данных Dask предлагают агрегирование только по групповым методам. Есть ли способ подражать поведению?

...