У меня есть набор данных, как показано ниже
id date time domain activity
1 20thdec 2 amazon add to basket
1 21stdec 2 amazon product view
1 21stdec 3 amazon add to basket
1 21stdec 4 amazon add to basket
2 21stdec 4 amazon add to basket
2 21stdec 6 amazon add to basket
Как избавиться от строк, содержащих одинаковое значение в столбце действия (т. Е. Для device_id = 2
единственное действие - add to basket
. Я все еще хочу сохранить формат для id 1
, который имеет несколько (дубликат) значения add to basket
, но имеет и другую активность
Я пытался pd.drop_duplicates
, однако это не решает проблему.
Редактировать: Ни одно из приведенных ниже решений не работает, мне нужен вывод, как показано ниже
id date time domain activity
1 20thdec 2 amazon add to basket
1 21stdec 2 amazon product view
1 21stdec 3 amazon add to basket
1 21stdec 4 amazon add to basket
Данные для id = 2 должны быть удалены, так как все действия, независимо от даты / времени, не содержат ничего, кроме добавления в корзину, поэтому следует удалять все отдельные строки действий и сохранять только те строки данных, в которых указано несколько действий, т.е. в id = 1 есть 2 уровня активности (просмотр товара и добавление в корзину)
Извинения, если это вызвало какое-либо неправильное толкование
Спасибо