Я создал agebin
столбец из age
столбцов.У меня есть диапазон ages
, но как я могу преобразовать их в agebin
числовой тип данных, потому что я хочу проверить, является ли agebin
важной функцией или нет.
Я попробовал следующий код для определения возраста:
traindata = data.assign(age_bins = pd.cut(data.age, 4, retbins=False, include_lowest=True))
data['agebin'] = traindata['age_bins']
data['agebin'].unique()
[[16.954, 28.5], (28.5, 40], (40, 51.5], (51.5, 63]]
Categories (4, object): [[16.954, 28.5] < (28.5, 40] < (40, 51.5] < (51.5, 63]]
Что я пробовал:
data['enc_agebin'] = data.agebin.map({[16.954, 28.5]:1,(28.5, 40]:2,(40, 51.5]:3,(51.5, 63]:4})
Я пытался отобразить каждый диапазон и преобразовать его в числовой, но я получаю синтаксическую ошибку.Пожалуйста, предложите хороший метод для преобразования agebin
, который является категоричным в числовые данные.