Я использую возраст в качестве одного из предикторов риска смертности пациентов. В имеющемся у меня наборе данных возрасты помещаются в 5-летние корзины (например, 21-25, 26-30), за исключением самой молодой (<20) и самой старой (> 90) групп.
Без этих исключений я думал об использовании среднего возраста в каждой корзине. Если я не могу этого сделать, мне было бы интересно, следует ли мне использовать кодировку меток или кодирование в одно касание, чтобы преобразовать эту функцию в виде чисел c.
Любые предложения приветствуются!