В общем, вы не должны вычислять среднее значение или что-либо другое из набора тестов (лучший способ думать о наборе тестов - это то, что он просто не существует, по крайней мере, пока вы уже не обучили свою модель).
Создайте конвейер преобразования, который может обрабатывать все необходимые этапы предварительной обработки (вменять недостающие данные, стандартизировать, выполнять требуемые функции проектирования, уменьшение размерности ...) на обучающем наборе и когда приходит новое наблюдение (мы должны обработать тест установить только новые наблюдения, которые недоступны во время обучения) применить этот конвейер преобразований к этим новым данным.