У меня есть кадр данных, который выглядит следующим образом:
ID1 ID2 Date
1 2 01/01/2018
1 2 03/01/2018
1 2 04/05/2018
2 1 06/06/2018
1 2 08/06/2018
3 4 09/07/2018
и т. Д.
Что мне нужно сделать, это отметить первый раз, когда идентификатор в ID1 появляется в ID2.В приведенном выше примере это будет выглядеть так:
ID1 ID2 Date Flag
1 2 01/01/2018
1 2 03/01/2018
1 2 04/05/2018
2 1 06/06/2018
1 2 08/06/2018 Y
3 4 09/07/2018
Я использовал следующий код, чтобы сообщить мне, встречается ли ID1 в ID2:
ID2List= df['ID2'].tolist()
ID2List= list(set(IDList)) # dedupe list
df['ID1 is in ID2List'] = np.where(df[ID1].isin(ID2List), 'Yes', 'No')
Но это только говорит о том, чтоэто случай, когда ID1 появляется в ID2 в какой-то момент, но не в тот момент, когда это происходит впервые.
Любая помощь?