Скажите, что у меня есть датаФрейм панд ниже:
A B C D
1 foo one 0 0
2 foo one 2 4
3 foo two 4 8
4 cat one 8 4
5 bar four 6 12
6 bar three 7 14
7 bar four 7 14
Я хотел бы выбрать все строки, которые имеют одинаковые значения в A, но разные значения в B. Поэтому я хотел бы, чтобы вывод моего кода был:
A B C D
1 foo one 0 0
3 foo two 4 8
5 bar three 7 14
6 bar four 7 14
Какой самый эффективный способ сделать это? У меня есть приблизительно 11 000 строк с большим разбросом значений столбцов, но эта ситуация часто возникает. В моем наборе данных, если элементы в столбце A равны, то значение соответствующего столбца B также должно быть равным, однако из-за неправильной маркировки это не так, и я хотел бы это исправить, для меня было бы нецелесообразно делать это путем один.