У меня есть два набора данных, один из которых представляет исправный набор данных с 4 переменными и 11 000 точек, а другой представляет ошибочный набор с 4 переменными и 600 точками. Я использовал пакет MClust R для получения кластеризации GMM для каждого набора данных отдельно. Я хочу получить оба кластера в одном кадре, чтобы изучать их одновременно. Как это можно сделать?
Я попытался объединить оба набора данных, но результат, который я получаю, - это не то, чего я хочу.
Используемый код:
Dat4M <- Mclust(Dat3, G = 3)
Dat3 - это место, где я храню свой набор данных, Dat4M - место, где я храню результат Mclust. G = 3 - это число гауссовых смесей, которое я хочу, и в данном случае это три. Для построения результата используется следующий код:
plot(Dat4M)
При применении вышеуказанного кода в моем наборе данных Healthy получается следующее:
![Density curve for Healthy data G = 3](https://i.stack.imgur.com/9dEVx.jpg)
При использовании вышеуказанного кода в наборе данных с ошибками получается следующее:
![Density curve for Faulty data G = 3](https://i.stack.imgur.com/dg1AM.jpg)
Обратите внимание, что на кривой плотности ошибочных данных, рассмотрим смесь CCD и CCA, мы видим, что были получены две точки плотности. Теперь я хочу поместить то же самое в один и тот же блок в исправных данных и изучить различия.
Буду признателен за любую помощь в том, как это сделать.