Итак, у меня есть набор данных, который включает даты и значения, соответствующие этим датам.
date value category
1951-07 199 1
1951-07 130 3
1951-07 50 5
1951-08 199 1
1951-08 50 5
1951-08 199 1
1951-09 184 2
1951-09 50 5
1951-09 13 13
Теперь моя цель - найти значения, которые повторяются каждый месяц. В результате получается такой кадр:
date value category
1951-07 50 5
1951-08 50 5
1951-09 50 5
Также не касается значений, которые повторяются в течение месяца или повторяются только в течение нескольких месяцев, но не все.
Категории часто имеют значение pai (как показано в примере), но иногда это не так. Поэтому я попытался сделать это по категориям, но это не дало мне точных результатов.
Мой текущий подход состоит в том, чтобы отфильтровать дубликаты, а затем получить их, которые встречаются 12 раз (так как я ищу в год). Но это также дает мне значения, которые повторяют 12 сторон в течение месяца.
df = df[df.duplicated(['value'],keep=False)]
v = df.value.value_counts()
df_12 = df[df.value.isin(v.index[v.gt(12)])]
Любая помощь будет оценена.