Question

Я бы хотел отфильтровать результаты панды groupBy напрямую, без необходимости сначала сохранять результат groupBy в переменной.Например:

df = pd.DataFrame([("a", 1)]*3+[("b", 1)]*2+[("c", 1)], columns=["title", "counts"])

res = df.groupby("title").agg({"counts":"sum"}) # I want to skip creating res

my_res = res.loc[res.counts >2]

В приведенном выше примере я хотел бы создать my_res с одной строкой.В Spark / Scala это может быть достигнуто просто путем объединения операций фильтра, но в pandas фильтр имеет другое назначение.

cs95 · Answer 1 · 06 февраля 2019

Используйте query, чтобы связать этот шаг:

df.groupby("title").agg({"counts":"sum"}).query('counts > 2')

       counts
title        
a           3

Фильтрация панд GroupBy на выходе за один шаг (метод цепочки)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Фильтрация панд GroupBy на выходе за один шаг (метод цепочки)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы