Перекрестная проверка модели смеси Гаусса - PullRequest
1 голос
/ 13 февраля 2020

Я хотел бы перекрестно проверить мою модель гауссовой смеси. В настоящее время я использую метод cross_validation от sklearn, как показано ниже.

clf = GaussianMixture(n_components=len(np.unique(y)), covariance_type='full')
cv_ortho = cross_validate(clf, parameters_train, y, cv=10, n_jobs=-1, scoring=scorer)

Я вижу, что cross_validation обучает мой классификатор с помощью y_train, что делает его контролируемым классификатором.

try:
    if y_train is None:
        estimator.fit(X_train, **fit_params)
    else:
        estimator.fit(X_train, y_train, **fit_params)

Однако я хотел провести перекрестную проверку неконтролируемого классификатора clf.fit(parameters_train). Я понимаю, что классификатор затем назначает свои собственные метки классов. Так как у меня есть два выделенных кластера (см. Изображение) и y я могу расшифровать соответствующие метки. Затем проведите перекрестную проверку. Есть ли в sklearn подпрограмма, которая делает это?

Подпрограмма, аналогичная этому примеру: https://scikit-learn.org/stable/auto_examples/mixture/plot_gmm_covariances.html

enter image description here

1 Ответ

2 голосов
/ 14 февраля 2020

Кажется, что типичная перекрестная проверка не является чем-то, что имеет смысл или использовалось для обучения без учителя (см. этот вопрос о перекрестном обмене стеками).

Почему это так? не имеет смысла?

В строгом случае перекрестная проверка требует некоторой основательной правды о «правильных» метках или значениях, предоставленных моделью. Обычно обозначается как y в определении методов scikit-learn. Когда вы тренируетесь по неконтролируемому способу, само представление о том, что тренинг не контролируется, означает, что нет ярлыков y; нет истинных ярлыков , нет «наземной правды». Это также поднимается в этом ответе на вопрос по оценке обучения без учителя (что является более широким термином, чем перекрестная проверка).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...