Так что я немного запутался.
На данный момент у меня есть набор данных около 800 экземпляров.Я разделил его на обучающий и проверочный набор, потому что отсутствовали значения, поэтому я использовал SimpleImputer из sklearn и fit_transform-ed обучающий набор и преобразовал тестовый набор.Я сделал это потому, что если я хочу прогнозировать новые экземпляры, если пропущены значения, мне нужно будет вменять его так же, как я вменял набор тестов.
Теперь я хочу использовать перекрестную проверку для обучения и оценки моделей, но это потребовало бы использования всего набора данных и разбиения его на различные учебные и тестовые наборы, поэтому я беспокоюсь об утечке из учебного набораиз-за вменяемых значений устанавливается?