Есть ли простой способ кластеризации в R, который формирует группы на основе двух отдельных метрик? - PullRequest
0 голосов
/ 12 июня 2019

Мне нужно создать n кластеров из моего фрейма данных, который имеет две отдельные метрики.Кластеры должны образовывать группы, которые похожи по обоим показателям.

Пакет Biclust, похоже, хочет получать результаты только для данных в матричном формате, которые у меня менее структурированы, чем эти.

d <- c(1:5, 0,0,2,2.2,5,  .01, .03, .53, .78, .99)
d <- matrix(d, nrow = 5, byrow = FALSE)
colnames(d) <- c("id", "overlap", "ps-cor")
d
     id overlap ps-cor
[1,]  1     0.0   0.01
[2,]  2     0.0   0.03
[3,]  3     2.0   0.53
[4,]  4     2.2   0.78
[5,]  5     5.0   0.99

Я бы тогда хотел иметь возможность использовать некоторую функцию кластеризации (предпочтительно, где я могу диктовать количество групп), чтобы я мог сделать

e <- cbind(d, c(1, 1, 2, 2, 3)
colnames(e)[4] <- "Group"
e
    id overlap ps-cor Group
[1,]  1     0.0   0.01     1
[2,]  2     0.0   0.03     1
[3,]  3     2.0   0.53     2
[4,]  4     2.2   0.78     2
[5,]  5     5.0   0.99     3

Я могу сделать это, создав свой собственный (плохой) кодно я чувствую, что там уже должен быть пакет, который может это сделать?Спасибо!

РЕДАКТИРОВАТЬ: убрал код

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...