У меня есть такой фрейм данных:
id company ......
111 A
222 B
333 B
111 E
444 C
555 C
555 C
333 A
111 A
222 D
444 C
, и я хотел бы получить строки, в которых id
встречается в одном и том же company
хотя бы дважды. Таким образом, результат будет:
id company .......
111 A
444 C
555 C
555 C
111 A
444 C
Хотя id 222
был там дважды, он был с другой компанией, поэтому он был удален. id 111
был там 3 раза, но только дважды с тем же company
. Таким образом, остаются только 2 строки из этого company
. И так далее.
Строки могут встречаться в одной и той же компании более чем в два раза.
Существуют некоторые вопросы по стеку, которые касаются выбора строк, в которых значение появляется более одного раза (например, Как выбрать строкив Pandas dataframe, где значение появляется более одного раза ), но я не могу найти ничего, что имеет дело с парой индекс + столбец, встречающейся более одного раза.