Действительно, это приведет к утечке данных, очень хорошо, что вы ее уловили!
Решение этой проблемы с использованием конвейера - это создать конвейер с помощью StandardScaler в качестве первой операции в конвейере, изатем ваш Классификатор выбора и в конечном итоге передать этот конвейер в GridSearchCV
clf = make_pipeline(StandardScaler(),
MyClassifier())
grid_search = GridSearchCV(clf, refit=True)
Для получения дополнительной информации, проверьте эту статью здесь