Как преобразовать DataFrame, который имеет уникальное значение только в одном столбце на основе одного столбца в конкретное значение в Pandas - PullRequest
0 голосов
/ 19 ноября 2018

У меня есть DataFrame следующим образом:

item_id    item_price 
1          10.0       
1          5.0        
1          6.0        
1          7.0        
2          2.0        
3          3.0        
4          5.0        

И я пытаюсь получить DataFrame, в котором столбец item_price состоит только из ряда уникальных значений. И удалите другие строки, которые не соответствуют этому условию, следующим образом:

 item_id    item_price         
 2          2.0        
 3          3.0        
 4          5.0

НО, я запутался в том, как реализовать это в Пандах. Любая помощь будет оценена.

1 Ответ

0 голосов
/ 19 ноября 2018

Используйте drop_duplicates с параметром subset для идентификации столбца для проверки дубликатов и keep=False для удаления всех строк дублирования:

df = df.drop_duplicates(subset=['item_id'], keep=False)
print (df)
   item_id  item_price
4        2         2.0
5        3         3.0
6        4         5.0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...