Это кажется довольно сфокусированным вопросом, но я думаю, что вы спрашиваете, как использовать polygon
для выделения сегмента нормального распределения.
Следующая функция нарисует для вас нормальное распределение:
plot_dnorm <- function(xmin, xmax, n = 1000, mu = 0, sd = 1,
xlab = "Value", ylab = "Density", ...)
{
x <- seq(xmin, xmax, length.out = n)
plot(x, dnorm(x, mu, sd), type = "l", xlab = xlab, ylab = ylab, ...)
}
Вы используете его, предоставляя нижний и верхний концы диапазона, который вы будете строить sh. Если вы хотите, вы можете указать среднее и стандартное отклонение. Если нет, то по умолчанию будет 0 и стандартное отклонение 1.
plot_dnorm(-3, 3)
Чтобы наложить многоугольник, вам необходимо определить, что координаты x и y - это то, что вы хотите. Вы можете получить многоугольник, который отслеживает сегмент нормального распределения, используя эту функцию:
plot_partial_dnorm <- function(xmin, xmax, n = 1000, mu = 0,
sd = 1, fill = "lightgray")
{
x <- seq(xmin, xmax, length.out = n)
y <- c(0, dnorm(x, mu, sd), 0)
x <- c(xmin, x, xmax)
polygon(x, y, col = fill)
}
Опять же, вы просто указываете ему диапазон, который хотите построить, а также среднее значение и стандартное отклонение, которое хотите. Вы также можете изменить цвет его заливки.
Таким образом, вы можете создать график следующим образом:
plot_dnorm(xmin = 0, xmax = 10, mu = 6.5, sd = 2)
plot_partial_dnorm(xmin = 4, xmax = 6, mu = 6.5, sd = 2, fill = "forestgreen")
As на ваш вопрос о том, что означает mu
в t.test
, это больше вопрос статистики, чем вопрос программирования, но по сути это значение, с которым вы проверяете среднее значение вашей выборки. Вы будете использовать его чаще всего при выполнении t.test с одним образцом.
Например, предположим, что вы взяли образец высоты мужчин в своем родном городе, чтобы узнать, были ли они выше или ниже, чем в среднем по стране - 175,3 см. Вы должны передать свой вектор измерений в t.test и установить mu = 175.3
. Результат t.test покажет вам вероятность того, что средний рост мужчин в вашем городе взят из населения с таким же средним значением, что и в среднем по стране. Другими словами, если вы получаете низкое значение p, средний рост мужчин в вашем городе, скорее всего, будет отличаться от среднего по стране.
Если вы проводите t.test, чтобы сравнить среднее значение двух выборки (например, у вас есть выборка мужского роста и женского роста), и вы хотите знать, что мужчины значительно выше женщин, тогда вы оставляете mu на нуле. Тогда вы спрашиваете: «Какова вероятность того, что разница между средним ростом мужчин и средним ростом женщин равна нулю?»