Question

Как выбрать только те строки, где val больше 5 до последней записи в каждом id этого образца данных?

df = pd.DataFrame({'id': [1,1,1,1,1,1,2,2,2,2,2,2],
                   'val': [10,1,1,10,20,30,1,1,1,12,17,28]})

id    val
1      10  <- meets the condition, but condition fails in the next 2 rows
1       1
1       1
1      10  <- meets the condition until the end of this id
1      20
1      30
2       1
2       1
2       1
2      12
2      17
2      28

Желаемый вывод:

Я могу сделать это с помощью некрасивого кода , если есть только один идентификатор , но я не знаю, как применить подобную логику ко всем группам:

df = pd.DataFrame({'id': [1,1,1,1,1,1],
               'val': [10,1,1,10,20,30]})

# create groups at breakpoints where condition is no longer met
g = df.groupby((df['val'] > 5).cumsum())

# find last group
label = max(list(g.groups.keys()))

result = df.loc[g.groups[label]._data]

# result still includes some rows where the condition is not met
result = result[result > 5]

cs95 · Answer 1 · 12 декабря 2018

Одна опция использует groupby и cumprod.

df[df.val.gt(5)[::-1].groupby(df.id).cumprod().reindex_like(df)]

Если у вас все в порядке с UserWarning, вы можете сократить это немного дальше:

df[df[df.val.gt(5)[::-1].groupby(df.id).cumprod()]

    id  val
3    1   10
4    1   20
5    1   30
9    2   12
10   2   17
11   2   28

cosmic_inquiry · Answer 2 · 12 декабря 2018

Использовать groupby, а затем фильтровать по val> 5:

df = pd.DataFrame({'id': [1,1,1,1,1,1,2,2,2,2,2,2],
                   'val': [10,1,1,10,20,30,1,1,1,12,17,28]})
df = df.groupby(['id','val']).first().reset_index()
print(df.loc[df['val'] > 5].to_string(index=False))

Выход:

Как выбрать Pandas Dataframe, где выполняется условие до последнего элемента группы?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как выбрать Pandas Dataframe, где выполняется условие до последнего элемента группы?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов