Возникли проблемы при настройке кластерной дендрограммы - PullRequest
0 голосов
/ 27 октября 2018

У меня есть набор данных из 305 последовательностей, для которых я выполнил выравнивание нескольких последовательностей с использованием пакета MUSCLE и создал матрицу расстояний, которая затем использовалась для кластеризации последовательностей и создания дендрограммы.Код, который я использовал, чтобы сделать следующее, здесь:

distanceMatrix1 <- dist.dna(dnaBin.Daphnia_Sequence, model = "TN93", as.matrix = TRUE, 
                            pairwise.deletion = TRUE)
Create a distance matrix using the alignment from muscle.

clusters.Daphnia <- IdClusters(distanceMatrix1,
                               method = "single",
                               cutoff= 0.02,
                               showPlot = TRUE,
                               type = "both",
                               verbose = TRUE)

Я хочу создать дендрограмму, которая имеет цветные ветви и показывает порядковый номер.Приведенный выше код создает дендрограмму, но у нее есть перекрывающиеся метки.enter image description here

Я попробовал другой метод для проверки.

dend <- clusters.Dendrogram
test <- dendro_data(dend, type = "rectangle")
p <- ggplot(segment(test)) +  
  geom_segment(aes(x = x, y = y, xend = xend, yend = yend)) + 
  coord_flip() + 
  scale_y_reverse(expand = c(0.2, 0))
p

Я получил следующую дендрограмму с ним.Я нахожу это приятным с эстетической точки зрения, но в нем отсутствуют цветные ветви и порядковые номера.enter image description here

Мне бы очень хотелось создать дендрограмму, имеющую обе цветные ветви для представления кластеров и порядковых номеров, чтобы я мог лучше анализировать дендрограмму.

...