Question

У меня есть набор данных, и один из столбцов содержит случайные числа, колеблющиеся от 300 до 400. Я пытаюсь найти, какая доля этого столбца между 320 и 350, используя R. Насколько я понимаю, мне нужно стандартизировать эти данныеи сначала создает кривую колокола.У меня есть среднее и стандартное отклонение, но когда я делаю (X - среднее) / SD и получаю гистограмму из этого столбца, это все равно не кривая колокола.

Это код, который я пробовал.

myData$C1 <- (myData$C1 - C1_mean) / C1_SD

Julius Vainora · Answer 1 · 14 апреля 2019

Если вы просто подсчитываете количество наблюдений в этом диапазоне, нет необходимости проводить какую-либо стандартизацию, и вы можете напрямую использовать

mean(myData$C1 >= 320 & myData$C1 <= 350)

Что касается стандартизации, то она определенно не создает никаких "Кривые колокола ": он только смещает распределение (центрирование) и изменяет масштаб данных (деление на стандартное отклонение).Кроме этого, сама форма функции плотности остается прежней.

Например,

x <- c(rnorm(100, mean = 300, sd = 20), rnorm(100, mean = 400, sd = 20))
mean(x >= 320 & x <= 350)
# [1] 0.065
hist(x)
hist((x - mean(x)) / sd(x))

Я подозреваюТо, что вы ищете, является оценкой истинной ненаблюдаемой пропорции.Тогда процедура стандартизации будет применима, если вам придется использовать табулированные значения стандартной функции нормального распределения.Однако в R мы можем сделать это без чего-либо подобного.В частности,

pnorm(350, mean = mean(x), sd = sd(x)) - pnorm(320, mean = mean(x), sd = sd(x))
# [1] 0.2091931

Это вероятность P (320 <= X <= 350), где X обычно распределяется со средним <code>mean(x) и стандартным отклонением sd(x).Эта цифра сильно отличается от приведенной выше, поскольку мы неправильно определили базовое распределение, считая его нормальным;на самом деле это смесь двух нормальных распределений.

Как стандартизировать столбец данных в R и получить гистограмму кривой Белла для получения процента, который попадает в диапазоны?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как стандартизировать столбец данных в R и получить гистограмму кривой Белла для получения процента, который попадает в диапазоны?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы