Поддерживает ли sklearn.pipeline разветвление? - PullRequest
0 голосов
/ 28 июня 2018

Предположим, у меня есть два конвейера:

pipln1 = Pipeline([("trsfm1",transformer_1),
                   ("trsfm2",transformer_2),
                   ("estmtr1",estimator_1)])

pipln2 = Pipeline([("trsfm1",transformer_1),
                   ("trsfm3",transformer_3),
                   ("estmtr2",estimator_2)])

Два линейных конвейера делят один и тот же шаг, trsfm1.

Можно ли избежать вычисления trsfm1 дважды?

1 Ответ

0 голосов
/ 28 июня 2018

Вы бы хотели что-то вроде

vect = transformer_1() # Или все, что нужно!

vX = vect.fit_transform(Xtrain) или в зависимости от того, как вы примените transformer_1

и ТО

pipln1 = Pipeline([("trsfm2",transformer_2),
                   ("estmtr1",estimator_1)])

pipln2 = Pipeline([("trsfm3",transformer_3),
                   ("estmtr2",estimator_2)])

и затем примените два Pipeline к vX

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...