У меня есть данные 1D (на данных столбца). Я использовал Gaussian Mixture Model (GMM) в качестве оценки плотности, используя эту реализацию в Python: https://scikit-learn.org/stable/modules/generated/sklearn.mixture.GaussianMixture.html. Опираясь на критерий AIC / BI C, я смог определить количество компонентов. После того, как я установил GMM, я составил оценку плотности ядра исходного наблюдения + выборочных данных, взятых из GMM. Сюжет оригинальных и отобранных снимков тихо похож (это хорошо). Но я хотел бы, чтобы некоторые показатели сообщали, насколько хороша подобранная модель.
g = GaussianMixture(n_components = 35)
data= df['x'].values.reshape(-1,1) # data taken from data frame (10,000 data pints)
clf= g.fit(data)# fit model
samples= clf.sample(10000)[0] # generate sample data points (same # as original data points)
Я нашел оценку в реализации, но не уверен, как реализовать. Я делаю это неправильно? или есть какой-нибудь лучший способ показать, насколько точна подобранная модель, кроме гистограммы или графиков плотности ядра?.
print(clf.score(data))
print(clf.score(samples))