У меня есть набор данных, где наблюдения имеют широкий диапазон (от 10 000 до 21 000 000). Я пытаюсь наложить распределение Пуассона на эти данные, но распределение выводится неправильно. До сих пор я пытался использовать этот код:
dat <- read.csv('data.csv', TRUE, ',')
hist(dat,
main = 'Global Sales of Games in 2010',
xlab = 'Amount of Copies Sold',
ylab = 'Counts',
col = 'palegreen1',
breaks = 100
)
lam = mean(dat)
t = seq(min(dat), max(dat), length.out = 10000)
lines(t, dpois(t, lambda = lam), col='red', lwd=3)
Я также пробовал это делать, генерируя данные из распределения Пуассона с использованием rpois, но все еще сталкивался с той же проблемой.
simulated = rpois(length(dat), lam)
simulated_lam = mean(simulated)
a = seq(min(simulated), max(simulated), length.out = 10000)
hist(simulated)
lines(a, dpois(a, lambda = simulated_lam), col='red', lwd=3)
Я ссылался на этот вопрос здесь, но не могу дать такие же результаты. R: Наложение распределения Пуассона по гистограмме данных
У меня есть изображения полученного результата, но я не могу опубликовать его из-за того, что это новая учетная запись. Если кто-нибудь знает альтернативный способ размещения изображений, я с радостью смогу продолжить.
Заранее спасибо.