Р: Могу ли я «установить» мою дендрограмму с помощью цикла for, используя dendextend? - PullRequest
0 голосов
/ 29 августа 2018

Учитывая набор данных iris в качестве примера, я делаю кластеры Пирсона, используя dendextend следующим образом:

library(RColorBrewer)
library(dendextend)
data(iris)
newmat <- iris[,1:4]
rownames(newmat) <- paste(iris$Species, rownames(iris))

dmat <- 1 - cor(t(newmat), method="pearson")
dmat <- as.dist(dmat)
clust.obj <- hclust(dmat, method="complete")
dend.obj <- as.dendrogram(clust.obj)
numsamples <- length(rownames(newmat))
maxdist <- max(get_nodes_attr(dend.obj, "height"))

groups <- levels(iris$Species)
cols <- colorRampPalette(brewer.pal(length(groups), "Set1"))
myPal <- cols(length(groups))

vals1 <- grep(groups[1], labels(dend.obj), value=TRUE)
vals2 <- grep(groups[2], labels(dend.obj), value=TRUE)
vals3 <- grep(groups[3], labels(dend.obj), value=TRUE)
vals1B <- grepl(groups[1], labels(dend.obj))
vals2B <- grepl(groups[2], labels(dend.obj))
vals3B <- grepl(groups[3], labels(dend.obj))

dend.obj <- dend.obj %>%
  set("leaves_pch", 19) %>%
  set("leaves_cex", 1) %>%
  set("branches_lty", 2) %>%
  set("by_labels_branches_col", value = vals1, TF_values = c(myPal[1],Inf)) %>%
  set("by_labels_branches_lwd", value = vals1, TF_values = c(2,Inf)) %>%
  set("by_labels_branches_lty", value = vals1, TF_values = c(1,Inf)) %>%
  set("by_labels_branches_col", value = vals2, TF_values = c(myPal[2],Inf)) %>%
  set("by_labels_branches_lwd", value = vals2, TF_values = c(2,Inf)) %>%
  set("by_labels_branches_lty", value = vals2, TF_values = c(1,Inf)) %>%
  set("by_labels_branches_col", value = vals3, TF_values = c(myPal[3],Inf)) %>%
  set("by_labels_branches_lwd", value = vals3, TF_values = c(2,Inf)) %>%
  set("by_labels_branches_lty", value = vals3, TF_values = c(1,Inf)) %>%
  set("labels_colors", ifelse(vals1B, myPal[1], ifelse(vals2B, myPal[2], myPal[3]))) %>%
  set("leaves_col", ifelse(vals1B, myPal[1], ifelse(vals2B, myPal[2], myPal[3])))

png(filename="test.png", height=1200, width=400)
mar.default <- c(5,4,4,2) + 0.1
par(mar = mar.default + c(0, 0, 0, 4))
plot(dend.obj, main="test cluster", xlab="Distance", horiz=TRUE, cex.main=1, cex.axis=1, cex.lab=1)
legend(maxdist, numsamples, groups, cex=1, pch=19, col=myPal)
dev.off()

Который производит этот кластер, который я считаю действительно полезным с цветами и всем:

test

Проблема в том, что теперь я хочу инкапсулировать это в функцию. И длина groups может варьироваться. Поэтому мне нужно сделать set часть dend.obj внутри цикла for или что-то в этом роде.

Что-то вроде:

for (i in 1:length(groups)){
    set("by_labels_branches_col", value=grep(groups[i],labels(dend.obj),value=TRUE), TF_values=c(myPal[i],Inf)) %>%
    set("by_labels_branches_lwd", value=grep(groups[i],labels(dend.obj),value=TRUE), TF_values=c(2,Inf)) %>%
    set("by_labels_branches_lty", value=grep(groups[i],labels(dend.obj),value=TRUE), TF_values=c(1,Inf))
}

Что, очевидно, не работает ... И то же самое относится к ifelse там, что было бы действительно сложно.

Любая помощь будет принята с благодарностью! Я понятия не имею, как справиться с этим. Спасибо!

1 Ответ

0 голосов
/ 30 августа 2018

Хорошо, если кому-то интересно, то, что я сделал в конце, который, кажется, работает должным образом, это сделать цикл for и сохранить команды в переменной execval, а затем запустить эту переменную с помощью:

eval(parse(text=execval))
...