Вы можете использовать sklearn.compose.ColumnTransformer
для ограничения количества столбцов;Идея состоит в том, чтобы указать ColumnTransformer.remainder = "drop"
.
Например, если ваш конвейер начинается с DataFrameMapper, который создает матрицу из 5 столбцов, но вы хотите сохранить только первые четыре столбца:
pipeline = PMMLPipeline([
("mapper", DataFrameMapper[...]),
("slicer", ColumnTransformer([
("keep", "passthrough", [0, 1, 2, 3])
], remainder = "drop"),
("estimator", ...)
])
Поддержка ColumnTransformer
доступна, начиная с последней версии SkLearn2PMML 0.42.0, поэтому вам может потребоваться сначала обновить ее до *. 1009 *