Мне нужно вычислить и визуализировать кластерный анализ из R в Power BI Desktop. Я использую функцию set.seed()
для предотвращения изменения кластеров (создайте с функцией kmeans
, чтобы она менялась со временем. Сначала я запускаю этот код в Power BI Desktop, а затем в следующий раз публикую и запускаю в службах Power BI. И вот проблема, потому что в настольном компьютере Power BI кластеры (в другом порядке) отличаются от сервисов Power BI.
Часть кода R:
set.seed(123)
km.res <- kmeans(scale(costs_noout_of), 4, nstart = 25)
dd <- cbind(costs_noout_all
, cluster = km.res$cluster)
grid.table(ddply(dd, .(cluster), nrow))
И в результате получается таблица, в которой указаны только числа кластеров и количество наблюдений в этих кластерах, которые мне нужны в следующих вычислениях.
Может кто-нибудь мне поможет?