Я пытаюсь провести предварительную обработку и подготовить набор данных для обучения модели.Набор данных имеет некоторые числовые и категориальные особенности.Давайте предположим, что это набор данных (представленный как Pandas DataFrame):
Age,Gender,Height
23,M,170
33,M,195
31,F,165
, и мы хотим преобразовать его в следующий формат, , используя только функции Transform в scikit-learn 0.19.0 иодин объект конвейера :
Age,Gender_M,Gender_F,Height
0.0,1,0,170
1.0,1,0,195
0.8,0,1,165
Преобразования следующие:
Возраст: MinMaxScaler
Пол: OneHotEncoder
Высота: без изменений
Возможно ли это вообще (альтернатива, чтобы немного упростить, - на данный момент отказаться от функции Высота)?
В моих собственных попытках найти решение язаметил, что нет способа применить функцию Transform к подмножеству всех функций, что заставило меня поверить, что это невозможно сделать с помощью одного конвейера.Но я буду счастлив, что окажусь неправым.
Спасибо