Как стандартизировать данные с определенным средним значением и значением стандартного отклонения - PullRequest
0 голосов
/ 24 апреля 2020

Как мне стандартизировать набор данных с определенным средним значением и значением стандартного отклонения?

Я знаю, что существуют пакеты, подобные sklearn.preprocessing.StandardScaler, но этот пакет позволяет нам только стандартизировать набор данных с использованием собственного среднего и стандартного набора данных значение отклонения. Что если я хочу стандартизировать набор данных, используя мое собственное указанное среднее значение и значение стандартного отклонения?

Есть ли в Python пакет, который я мог бы использовать? В противном случае я мог бы придумать способ сделать это вручную для каждой функции (ie. (X-mean)/(stddev) для каждой функции в наборе данных, где mean = мое собственное указанное среднее значение, stddev = мой собственный указанный стандарт значение отклонения).

Заранее спасибо.

1 Ответ

0 голосов
/ 24 апреля 2020

Причина существования sklearn.preprocessing.StandardScaler для таких вещей, как машинное обучение по требованию и тому подобное. Используется в трубопроводах. Это работает само по себе, но это использование молотка ила на та c. Способ, который вы описали, является единственным способом изменения масштаба данных, которые вы считаете подходящими с вашими собственными параметрами. Моя единственная рекомендация будет использовать массив; поскольку массивы проецируют свои операции на все свои записи автоматически, поэтому код выглядит лучше.

import numpy

data = numpy.array([1,2,3,34,2,2,3,43,4,3,2,3,4,4,5,56,6,43,32,2,2])

#Custom mean and std.
new_data = (data-10)/5

#Using the array's mean and std. 
new_data = (data-data.mean())/data.std()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...