В статистике стандартное отклонение и дисперсия - это показатели того, насколько показатель в популяции отклоняется от среднего значения (обычно среднего.)
Стандартное отклонение определяется как квадратный корень из дисперсии, а дисперсия определяется как среднее квадрата разности от среднего значения, т.е.
Для населения размера n: x1, x2, ..., xn
со средним: xmean
Stdevp = sqrt (((x1-xmean) ^ 2 + (x2-xmean) ^ 2 + ... + (xn-xmean) ^ 2) / n)
Когда значения для всего населения недоступны (большую часть времени), обычно применяется поправка Бесселя, чтобы получить лучшую оценку фактического стандартного отклонения для всего населения. При вычислении дисперсии поправка Бесселя просто делится на n-1, а не на n, то есть:
Stdev = sqrt (((x1-xmean) ^ 2 + (x2-xmean) ^ 2 + ... + (xn-xmean) ^ 2) / (n-1))
Обратите внимание, что для достаточно больших наборов данных не имеет значения, какая функция используется.
Вы можете проверить мой ответ, запустив следующий скрипт T-SQL:
-- temporary data set with values 2, 3, 4
declare @t table([val] int);
insert into @t values
(2),(3),(4);
select avg(val) as [avg], -- equals to 3.0
-- Estimation of the population standard devisation using a sample and Bessel's Correction:
-- ((x1 - xmean)^2 + (x2 - xmean)^2 + ... + (xn-xmean)^2)/(n-1)
stdev(val) as [stdev],
sqrt( (square(2-3.0) + square(3-3) + square(4-3))/2) as [stdev calculated], -- calculated with value 2, 3, 4
-- Population standard deviation:
-- ((x1 - xmean)^2 + (x2 - xmean)^2 + ... + (xn-xmean)^2)/n
stdevp(val) as [stdevp],
sqrt( (square(2-3.0) + square(3-3) + square(4-3))/3) as [stdevp calculated] -- calculated with value 2, 3, 4
from @t;
Дальнейшее чтение статей в Википедии: Стандартное отклонение n и Исправление Бесселя .