Дерево консенсуса или «пропорции начальной загрузки» из нескольких объектов hclust - PullRequest
2 голосов
/ 29 октября 2009

У меня есть список объектов hclust, возникающих в результате незначительных изменений в одной переменной (для расчета матрицы расстояний)

  • Теперь я бы хотел создать дерево консенсуса из этого списка.

Есть ли общий пакет для этого? Я прохожу свой путь через какой-то код от maanova и вроде бы работает - но это некрасиво и оно нужно много взломать, так как я не делаю "нормальную" самозагрузку (это химические данные).

/ Palle Villesen, Дания

c1_list <- seq(10,100,by=10)
c2 <- 30
e<- 1
mboot <- list()
for (i in 1: length(c1_list) ) {
   c1 <- c1_list[i]
   cat("Doing C1=",c1,"...")
   x <- hclust(custom_euclidean(t(log2(data[, all]+1)), c1,c2,e), method='average')
   cat("..done\n")
   mboot[[i]] <- x # To get hclust object back use mbot[[i]] to get i'th object
}

#### Now extract the robust groups from mboot...

Ответы [ 2 ]

1 голос
/ 31 октября 2009

Во-первых, взгляните на код Аллана Такера для консенсусной кластеризации , относящийся к его статье "Консенсусная кластеризация и функциональная интерпретация данных экспрессии генов" .

Вот несколько других указателей:

0 голосов
/ 29 октября 2009

Хм, это звучит как метод повышения, применяемый к кластеризации, а быстрый поиск в Google обнаруживает довольно обширную литературу по повышению кластеризации . Может быть, это начало?

Что касается кода R, всегда есть виды задач на Кластеризация и Машинное обучение .

...