Как назначить метки значениям переменных - PullRequest
1 голос
/ 06 июня 2019

У меня есть базовый набор данных, где одна из переменных обозначает округ в Калифорнии.Это непрерывная переменная, где 1 является первым алфавитным округом, а 58 - последним по алфавиту.

Например:

ID      County  
1         1  
2         58  
3         5  
4         43  
5         2  
6         19  
7         42  
8         2  
9         1  
10        14  

В Stata я бы сделал следующее:

label define county_label 1 "Alameda" 2 "Alpine" 3 "Amador" 58 "Yuba"  
label val county county_label

Далее, используя команду tabulate, я получаю вывод ниже:

ID      County  
1         Alameda  
2         Yuba  
3         Calaveras  
4         Santa Clara  
5         Alpine  
6         Los Angeles  
7         Santa Barbara  
8         Alpine  
9         Alameda  
10        Inyo  

В Python я попытался создать словарь в качестве первого шага:

county_dictionary = {1 : 'Alameda', 2 : 'Alpine', ......  58 : 'Yuba'}  

Однако после этого я полностью потерялся;Я даже не уверен, если это вообще необходимо.

Как получить такой же вывод в Python?

1 Ответ

0 голосов
/ 06 июня 2019

Попробуйте это:

df['County'] = df.apply(lambda x: county_dictionary.get(x['County'], 'Unknown'), axis=1)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...