Если вы просто подсчитываете количество наблюдений в этом диапазоне, нет необходимости проводить какую-либо стандартизацию, и вы можете напрямую использовать
mean(myData$C1 >= 320 & myData$C1 <= 350)
Что касается стандартизации, то она определенно не создает никаких "Кривые колокола ": он только смещает распределение (центрирование) и изменяет масштаб данных (деление на стандартное отклонение).Кроме этого, сама форма функции плотности остается прежней.
Например,
x <- c(rnorm(100, mean = 300, sd = 20), rnorm(100, mean = 400, sd = 20))
mean(x >= 320 & x <= 350)
# [1] 0.065
hist(x)
hist((x - mean(x)) / sd(x))
Я подозреваюТо, что вы ищете, является оценкой истинной ненаблюдаемой пропорции.Тогда процедура стандартизации будет применима, если вам придется использовать табулированные значения стандартной функции нормального распределения.Однако в R мы можем сделать это без чего-либо подобного.В частности,
pnorm(350, mean = mean(x), sd = sd(x)) - pnorm(320, mean = mean(x), sd = sd(x))
# [1] 0.2091931
Это вероятность P (320 <= X <= 350), где X обычно распределяется со средним <code>mean(x) и стандартным отклонением sd(x)
.Эта цифра сильно отличается от приведенной выше, поскольку мы неправильно определили базовое распределение, считая его нормальным;на самом деле это смесь двух нормальных распределений.