Панды: Используются по приоритету записей, исключают повторяющиеся значения - PullRequest
0 голосов
/ 18 октября 2018

У меня есть дата панды, как это:

     FRUITS     COLOURS  
0     apple      red  
1     berry      black         
2     apple      green     
3     grapes     green    
4     apple      black          
5     grapes     red  
6     tomato     black
7     tomato     green  

с учетом порядка приоритетов ЦВЕТОВ красный> зеленый> черный, я хочу исключить все повторяющиеся записи в ФРУКТАХ

Желаемый результат должен быть:

     FRUITS    COLOURS  
0     apple     red    
1     berry     black         
2     grapes    red  
3     tomato    green     

1 Ответ

0 голосов
/ 18 октября 2018

Вы можете установить порядок, установив COLOUR в упорядоченную категориальную категорию, затем отсортировав и отбросив дубликат FRUITS:

df['COLOURS'] = pd.Categorical(df['COLOURS'], categories=['red','green','black'],ordered=True)

df.sort_values('COLOURS').drop_duplicates('FRUITS').sort_index()

   FRUITS COLOURS
0   apple     red
1   berry   black
5  grapes     red
7  tomato   green
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...