Я ожидаю, что вы захотите нормализовать значения для данной функции по выборкам.Если вы нормализуете данные данного образца по его функциям, вы выбросили много информации.Это было бы для сравнения объектов (что редко имеет смысл), а не для сравнения образцов для объекта.
Я не знаю numy или sklearn, так что примите это с недоверием, но при нормализации выхотите нормализовать (используя те же параметры) все данные для данного объекта, чтобы привести все значения для этого объекта в диапазон (-1 ... +1) со средним значением, равным нулю (или что-то в этом роде).Вы сделали бы это отдельно для каждой функции, так что все они окажутся в этом диапазоне со средним значением каждой функции в нуле.
Рассмотрим пример, если вы нормализовали все функции для данного образца.
height weight age
person1 180 65 50
person2 140 45 50
Если мы нормализуем значения для person1 по всем функциям, а затем сделаем то же самое для person2, тогда у person2 будет возраст, отличный от person1!
Если мы нормализуем по всемувыборки для данного столбца, то отношения по-прежнему сохраняются.Их возраст будет соответствовать;person1 будет выше, а person2 будет весить меньше.Но все значения для всех функций будут соответствовать правилам распределения, необходимым для последующего анализа.