Повторяющиеся строки, но 1 столбец имеет другое значение. Оставьте только строки, которые являются дубликатами и имеют значение столбца c - PullRequest
0 голосов
/ 17 января 2020

У меня есть фрейм данных:

channelId | topic
a         | 1
a         | 0
b         | 0
b         | 1
c         | 0
d         | 1

Мне нужно удалить все дублирующиеся строки, имеющие значение topi c == 0.

Таким образом, конечный результат должен быть:

channelId | topic
a         | 1
b         | 1
c         | 0
d         | 1

Как я могу это сделать?

1 Ответ

2 голосов
/ 17 января 2020

Использование series.duplicated() и series.eq():

df[~(df['channelId'].duplicated(keep=False)&df['topic'].eq(0))]

  channelId  topic
0         a      1
3         b      1
4         c      0
5         d      1
...