при оценке типа и параметров распределения с использованием GAMLSS R я получаю разные оценки, когда превращаю данные в таблицы частот.в приведенном ниже примере кода fit1 и fit2 совпадают и дают правильные оценки, но fit3 и fit4 отключены.
library(gamlss)
rand1 <- rNBII(1000, mu = 5, sigma = 2)
fit1 <- histDist(rand1, family = "NBII")
fit2 <- fitDist(rand1, type = "count")
fit1$mu; fit1$sigma; fit2$mu; fit2$sigma #estimates match
df <- data.frame(table(rand1)) #turn data into frequency dataframe
colnames(df) <- c("y", "Freq") #change column names
df$y <- as.numeric(df$y)
df$Freq <- as.numeric(df$Freq)
fit3 <- histDist(df$y, freq = df$Freq, family = "NBII")
fit4 <- fitDist(df$y, freq = df$Freq, type = "count")
оценки fit3 не соответствуют реальным значениям, а оценка fit4 полностью отклонена, и даже это дает "DPO" как лучшее распределение.
Спасибо,