Я пытаюсь отфильтровать записи из Dataframe по их появлению. Я пытаюсь отфильтровать first occurence
, а затем на every third occurence
на основе emp_id. Ниже приведен пример моего Dataframe.
emp_id,date,value
101,2018-12-01,10001
101,2018-12-03,10002
101,2018-12-05,10003
101,2018-12-13,10004
В приведенном выше примере ожидаемый результат:
emp_id,date,value
101,2018-12-01,10001
101,2018-12-13,10004
Ниже приведен код, который я построил так далеко:
df['emp_id'] = df.groupby('emp_id').cumcount()+1
df['emp_id'] = np.where((df['emp_id']%3)==0,1,0)
Однако после этого возвращается 2nd occurence
и every third occurrence
. Как я могу изменить так, чтобы он возвращал обратно first occurence
, а затем every third occurence
на основе emp_id