Какой лучший способ обозначить новые категории в функции? - PullRequest
0 голосов
/ 11 марта 2019

Есть ли способ, как вручную назначить числовые метки для объекта, вырезанного в ячейки?

Я пробовал:

data['AgeBin'] = pd.cut(data['Age'].astype(int), 5, labels = [1,2,3,4,5])

и хотя метки должны быть определены как целое числокажется, что они на самом деле являются строкой.

Я сделал переопределение, используя

age_mapping = {'1':1, '2':2, ...}
data['AgeBin'].map(age_mapping)

, что работает, но мне действительно любопытно, есть ли лучший способ без использования LabelEncoder, так как я хочу сохранить ординальностьдля моей функции, и я хотел бы избежать здесь ОХЕ.

Мне также было интересно создать счетчик возрастной плотности, но я не знал, как его написать, если честно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...