Я думаю, что ответ на ваш предыдущий вопрос неправильный и вводящий в заблуждение, хотя, если честно, вы не очень четко задали вопрос.
Я думаю, вы, вероятно, пытаетесь сравнить биномиальное распределение с нормальным приближением к нему. Бином - это количество успехов, которые вы получаете, если вы делаете что-то N раз, и вероятность того, что вы добьетесь успеха, равна p. Среднее значение этого параметра - Np, а стандартное отклонение - sqrt (Np (1-p)), которое можно использовать для приближения его к нормальному распределению.
Один из способов их сравнения с использованием ggplot
будетбыть таким ...
library(tidyverse)
trials <- 100 #i.e. N in the explanation above
prob <- 0.1 #i.e. p in the explanation above
sims <- 100000 #the number of simulations you want (1e5 in your previous question)
df <- tibble(n = 1:sims,
normal = sort(rnorm(sims, #no of variates
trials * prob, #mean
sqrt(trials * prob * (1-prob)))), #standard deviation
binomial = sort(rbinom(sims,
trials,
prob)))
Затем, чтобы сравнить (дискретную) гистограмму биномиального распределения (красным) с (непрерывной) плотностью нормального приближения (синим), вы можете сделать
df %>% ggplot() +
geom_density(aes(x = normal),
alpha = 0.5,
fill = "blue") +
geom_histogram(aes(x = binomial,
y = stat(density)), #normalises scale to sum to 1
alpha = 0.5,
fill = "red",
binwidth = 1)

И сравнить кумулятивные распределения (используя тот факт, что мы отсортировали переменные в нашем фрейме данных) ...
df %>% ggplot(aes(y = n/sims)) +
geom_line(aes(x = normal),
colour = "blue") +
geom_line(aes(x = binomial),
colour = "red")

Надеюсь, это поможет!