Я ищу, чтобы найти непоследовательные дубликаты строк в кадре данных Pandas. Примечание: я использовал Shift, но не смог получить желаемый результат.
Abc аа аа аа аа бб бб бб аа бб куб.см куб.см бб куб.см куб.см
Желаемый выход: аа бб бб куб.см
Хорошо, вот код, который я сделал для этого.
a = df[df['ABC'].shift(1) != df['ABC']] b= df.drop_dupicates('ABC') c = a[~a.isin(b)]
вывод: aa bb bb cc
при условии, что ваш ожидаемый результат не верен ...
df[df['ABC'].shift(-1) != df['ABC']] ABC 3 aa 6 bb 7 aa 8 bb 10 cc 11 bb 13 cc