Скажем, у меня есть столбец в кадре данных, который является 'user_age', и я создал 'user_age_bin' чем-то вроде:
df['user_age_bin']= pd.cut(df['user_age'], bins=[10, 15, 20, 25,30])
Затем я строю модель машинного обучения с использованием 'user_age_bin' feature.
Затем я получил одну запись, которую мне нужно добавить в мою модель и сделать прогноз. Я не хочу использовать user_age
как есть, потому что модель использует user_age_bin
. Итак, как я могу преобразовать значение user_age
(скажем, 28) в user_age_bin
? Я знаю, что могу создать такую функцию:
def assign_bin(age):
if age < 10:
return '<10'
elif age< 15:
return '10-15'
... etc. etc.
и затем выполнить:
user_age_bin = assign_bin(28)
Но это решение совсем не элегантно. Я думаю, что должен быть лучший способ, верно?
Редактировать: я изменил код и добавил явный диапазон бина. Edit2: отредактированная формулировка и, надеюсь, теперь вопрос стал яснее.