Гистограмма и метод выборки верны.
Сравните результаты со следующим (который использует функцию выборки R Коши).
c.samp2 <- rcauchy(n)
hist(c.samp2, breaks = 90, col = "blue",
main = "Hist of Cauchy 2")
Вывод здесь также выглядит неверно, но это не так.
Во-первых, вы должны заметить, что ось x по умолчанию выбрана на основе экстремальных значений, с которыми вы можете столкнуться. Как вы, вероятно, знаете, распределение Коши чрезвычайно жирнохвостое и очень велико, но ожидаются редкие значения. При запуске 10000 выборок из распределения Коши эти относительно немногие единичные измерения сжимают график и не отображаются на графике, потому что для каждого бина в этих экстремумах выделяется очень мало наблюдений.
Параметры по умолчанию для того, как hist
выбирает ячейки, также плохо подходят для распределения, как Коши. Попробуйте, например,
hist(c.samp2, breaks = "FD", col = "blue",
bins = 50,
main = "Hist of Cauchy 2",
xlim = c(-500, 500))
![enter image description here](https://i.stack.imgur.com/fwvUB.png)
Предлагаю внимательно прочитать страницу help("hist")
и поиграться с параметрами, чтобы получить хорошую и полезную гистограмму.
Изменяя выбранные диапазоны по оси X, используя шкалу вероятности по оси Y, добавляя теоретическое распределение и «коврик», вы получаете что-то более полезное.
hist(c.samp, breaks = "FD", col = "blue",
main = "Hist of Cauchy distribution",
xlim = c(-50, 50),
freq = FALSE)
curve(dcauchy, add = TRUE, col = "red")
rug(c.samp)
![enter image description here](https://i.stack.imgur.com/G1dTs.png)
Обратите внимание, что использование c.samp
или c.samp2
теперь почти не меняет сюжет.