Априори я знаю, что приведенное ниже распределение представляет собой сумму двух отдельных распределений, которые будут иметь разные средние значения и стандартные отклонения. Я пытаюсь смоделировать эти два дистрибутива с помощью R, пакета mixtools, функции normalmixEM (). Я нанес на гистограмму исходных данных полученные модели и обеспокоен тем, что модели не совпадают с моими данными в x-измерении.
Это повод для беспокойства? Означает ли это, что дистрибутивы просто ненормальные? Есть ли способ, которым это можно оптимизировать?
Ширина бина на гистограмме установлена в соответствии с разрешением данных, когда они намного шире, то соответствие выглядит лучше, что заставляет меня думать, что бины normalmixEM мои необработанные данные в больших ячейках, могу ли я контролировать, как эта функция объединяет данные?
Мой код:
fit <- normalmixEM(large_data_vector, k = 2, maxit = 100, maxrestarts = 10)
d <- unique(sort(large_data_vector))
hist(large_data_vector, breaks = d, xlim = c(0,1), probability = TRUE, main = "12P")
lines(d, dnorm(x = d, mean = fit$mu[1], sd = fit$sigma[1]) * fit$lambda[1], col = "blue")
lines(d, dnorm(x = d, mean = fit$mu[2], sd = fit$sigma[2]) * fit$lambda[2], col = "orange")
Гистограмма моих необработанных данных с двумя гауссовскими распределениями с помощью normalmixEM () из пакета R для микширования. Меня беспокоит, что пики модели не совпадают с пиками гистограммы моих необработанных данных.
Большое спасибо за любую помощь или предложения