Мне нужно создать n кластеров из моего фрейма данных, который имеет две отдельные метрики.Кластеры должны образовывать группы, которые похожи по обоим показателям.
Пакет Biclust, похоже, хочет получать результаты только для данных в матричном формате, которые у меня менее структурированы, чем эти.
d <- c(1:5, 0,0,2,2.2,5, .01, .03, .53, .78, .99)
d <- matrix(d, nrow = 5, byrow = FALSE)
colnames(d) <- c("id", "overlap", "ps-cor")
d
id overlap ps-cor
[1,] 1 0.0 0.01
[2,] 2 0.0 0.03
[3,] 3 2.0 0.53
[4,] 4 2.2 0.78
[5,] 5 5.0 0.99
Я бы тогда хотел иметь возможность использовать некоторую функцию кластеризации (предпочтительно, где я могу диктовать количество групп), чтобы я мог сделать
e <- cbind(d, c(1, 1, 2, 2, 3)
colnames(e)[4] <- "Group"
e
id overlap ps-cor Group
[1,] 1 0.0 0.01 1
[2,] 2 0.0 0.03 1
[3,] 3 2.0 0.53 2
[4,] 4 2.2 0.78 2
[5,] 5 5.0 0.99 3
Я могу сделать это, создав свой собственный (плохой) кодно я чувствую, что там уже должен быть пакет, который может это сделать?Спасибо!
РЕДАКТИРОВАТЬ: убрал код