Python pandas ищет непоследовательные дубликаты - PullRequest
0 голосов
/ 04 ноября 2018

Я ищу, чтобы найти непоследовательные дубликаты строк в кадре данных Pandas. Примечание: я использовал Shift, но не смог получить желаемый результат.

Abc
аа аа аа аа бб бб бб аа бб куб.см куб.см бб куб.см куб.см

Желаемый выход: аа бб бб куб.см

Ответы [ 2 ]

0 голосов
/ 21 ноября 2018

Хорошо, вот код, который я сделал для этого.

a = df[df['ABC'].shift(1) != df['ABC']]
b= df.drop_dupicates('ABC')
c = a[~a.isin(b)]

вывод: aa bb bb cc

0 голосов
/ 04 ноября 2018

при условии, что ваш ожидаемый результат не верен ...

df[df['ABC'].shift(-1) != df['ABC']]

    ABC
3   aa
6   bb
7   aa
8   bb
10  cc
11  bb
13  cc
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...