Фильтрация панд GroupBy на выходе за один шаг (метод цепочки) - PullRequest
0 голосов
/ 06 февраля 2019

Я бы хотел отфильтровать результаты панды groupBy напрямую, без необходимости сначала сохранять результат groupBy в переменной.Например:

df = pd.DataFrame([("a", 1)]*3+[("b", 1)]*2+[("c", 1)], columns=["title", "counts"])

res = df.groupby("title").agg({"counts":"sum"}) # I want to skip creating res

my_res = res.loc[res.counts >2] 

В приведенном выше примере я хотел бы создать my_res с одной строкой.В Spark / Scala это может быть достигнуто просто путем объединения операций фильтра, но в pandas фильтр имеет другое назначение.

1 Ответ

0 голосов
/ 06 февраля 2019

Используйте query, чтобы связать этот шаг:

df.groupby("title").agg({"counts":"sum"}).query('counts > 2')

       counts
title        
a           3
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...