Question

У меня есть простой sklearn.pipeline.Pipeline объект, который включает sklearn.impute.SimpleImputer и sklearn.preprocessing.KBinsDiscretizer следующим образом:

cont_pipe = Pipeline([('imp', SimpleImputer(strategy='median', add_indicator=False)),
                      ('disc', KBinsDiscretizer(n_bins=4, encode='onehot-dense', strategy='quantile'))])

Это работает, как и ожидалось. Однако, если я установлю add_indicator=True, дискретизатор будет применен и к новому столбцу. Как я могу избежать этого? Я попытался использовать sklearn.compose.ColumnTransformer и применить KBinsDiscretizer к указанному c индексу столбца, но для этого необходимо заранее знать индекс столбца, но это может измениться во время теста.

В конвейере sklearn с SimpleImputer и KBinsDiscretizer, как установить для add_indicator значение True без его дискретизации?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

В конвейере sklearn с SimpleImputer и KBinsDiscretizer, как установить для add_indicator значение True без его дискретизации?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов