Присвоение значений идентификаторов объектам, имеющим несколько характеристик - PullRequest
0 голосов
/ 04 марта 2019

имеет следующий набор данных

data = {'Country': ['UK','Ireland', 'Ireland', 'South Africa','Botswana','Italy','Greece'], 
        'Sub_ISO': ['Europe', 'Europe', 'Europe', 'Southern Africa','Southern Africa','Europe', 'Europe'], 
        'Language': ['EN', 'EN', 'IR',  'EN', 'EN', 'ITA', 'GRE'], 
        'count': [170,170, 170, 65,64,53,150]}
df = pd.DataFrame(data=data)

Я хотел бы иметь возможность идентифицировать с помощью уникального идентификационного номера те страны, которые находятся в одной и той же Sub_ISO и говорят на одном языке.Извините, я не уверен, как это сделать, поэтому я не могу предоставить гораздо больше кода.

Ожидаемый результат

enter image description here

**** РЕДАКТИРОВАТЬ

Ирландия и другие страны, в которых имеется более одного языкаповторяются

1 Ответ

0 голосов
/ 04 марта 2019

Этот, кажется, работает!

df['new_id'] = df.groupby(['ISO_Sub_Region','Official language']).ngroup()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...