Замечательный вопрос.У меня были похожие вопросы, когда я начинал несколько лет назад.Позвольте мне попытаться дать на это два моих цента.
Я предлагаю перейти к созданию скейлера для масштабирования X_train, сохранить его и посмотреть, будет ли он использован для преобразования X_test.Согласно теореме центральности, если вы сделали случайную выборку, у вас должно быть среднее значение и дисперсия, аналогичные атрибутам совокупности.В большинстве случаев скалер работает на основе этих двух параметров.Если он представляет параметры популяции, пока данные теста поступают из одной популяции, скалер должен работать.Если это не работает, вам нужно больше проб для обучения или другая попытка проб, чтобы получить X_train, представляющий население.
Делая это, вы уверены, что модель будет работать и с новыми образцами, пока она генерируется тем же процессом.В конце концов, модель не создана для тестирования, она предназначена для того, чтобы быть в производстве и выполнять какую-то полезную работу.
Моя рекомендация состоит в том, чтобы перейти к 3) масштабированию X_train и использовать инструмент масштабирования для преобразования X_test.