Предположим, у вас есть конвейер scikit-learn с двумя этапами: первый - объект преобразователя (например, PCA), а второй и последний - объект с методом прогнозирования (например, логистическая регрессия). Предположим, что ваша сетка содержит четыре разные конфигурации гиперпараметров, состоящие из двух разных количеств главных компонентов (для PCA) и двух разных параметров регуляризации (для логистических регрессий).
Установлен ли первый объект (PCA) 4 раза (по одному для каждой конфигурации)? Или, наоборот, он устанавливается только два раза: для каждого числа основных компонентов соответствует PCA один раз и дважды логистическая регрессия. Этот способ кажется более эффективным и эквивалентным с точки зрения результатов.
Я думал, что это был второй путь, но меня смутил комментарий на scit-learn github (https://github.com/scikit-learn/scikit-learn/issues/4813#issuecomment-205185156)