Построение различных кластеров моделей смеси на одной кривой - PullRequest
1 голос
/ 09 апреля 2019

У меня есть два набора данных, один из которых представляет исправный набор данных с 4 переменными и 11 000 точек, а другой представляет ошибочный набор с 4 переменными и 600 точками. Я использовал пакет MClust R для получения кластеризации GMM для каждого набора данных отдельно. Я хочу получить оба кластера в одном кадре, чтобы изучать их одновременно. Как это можно сделать?

Я попытался объединить оба набора данных, но результат, который я получаю, - это не то, чего я хочу.

Используемый код:

    Dat4M <- Mclust(Dat3, G = 3)

Dat3 - это место, где я храню свой набор данных, Dat4M - место, где я храню результат Mclust. G = 3 - это число гауссовых смесей, которое я хочу, и в данном случае это три. Для построения результата используется следующий код:

    plot(Dat4M)

При применении вышеуказанного кода в моем наборе данных Healthy получается следующее:

Density curve for Healthy data G = 3

При использовании вышеуказанного кода в наборе данных с ошибками получается следующее:

Density curve for Faulty data G = 3

Обратите внимание, что на кривой плотности ошибочных данных, рассмотрим смесь CCD и CCA, мы видим, что были получены две точки плотности. Теперь я хочу поместить то же самое в один и тот же блок в исправных данных и изучить различия.

Буду признателен за любую помощь в том, как это сделать.

...