Установка edge.lenth в объекте phylo с использованием переменной в data.frame - PullRequest
0 голосов
/ 26 ноября 2018

Я хочу установить «edge.length» в объекте phylo, используя переменную в data.frame.«Node.label» «tip.label» в объекте phylo соответствует именам строк в data.frame.Как можно задать значение edge.length, используя переменную в data.frame, и убедиться, что данные сопоставлены правильно?В приведенном ниже коде это на шаге 3. Я хочу, чтобы значение edge.length соответствовало так, чтобы node.label или tip.label соответствовали row.name в data.frame.

## R code:
## load ape
library(ape)
## 1. A phylo object:
library(data.tree)

A1  <- Node$new("A1")
B1  <- A1$AddChild("B1")
C1  <- B1$AddChild("C1")
D1  <- C1$AddChild("D1")
E1 <- C1$AddChild("E1")
F1 <- E1$AddChild("F1")
G1 <- E1$AddChild("G1")
H1 <- G1$AddChild("H1")
A1.phylo <- as.phylo.Node(A1)


## 2. A data.frame:
set.seed(1)
df <- as.data.frame(rnorm(7, 5, 3))
names(df) <- "length"
row.names(df) <- c("B1","C1","D1","E1","F1","G1","H1")

## 3. Ad the data to A1.phylo$edge.length
A1.phylo$edge.length <- df$length ## wrong!!!

1 Ответ

0 голосов
/ 27 ноября 2018

Длина ребер, метки наконечников и метки узлов в объектах "phylo" обрабатываются в порядке их появления в таблице кромок.Поэтому вы всегда должны приписывать различные элементы, следя за тем, чтобы они были в правильном порядке, прежде чем их приписать.Например (извините, я не смог воспроизвести ваш пример):

set.seed(1)
## A random tree with 6 edges
test_tree <- rtree(4)

## The edge table
test_tree$edge
#     [,1] [,2]
#[1,]    5    1
#[2,]    5    6
#[3,]    6    2
#[4,]    6    7
#[5,]    7    3
#[6,]    7    4

Здесь ребрами являются все элементы, соединяющие узел (цифры >4) с наконечником (цифры <5).Вы можете визуализировать их (и их нумерацию), используя plot:

## Visualising all the elements
plot(test_tree, show.tip.label = FALSE)
edgelabels()
nodelabels()
tiplabels()

Так что теперь, если у вас есть такой кадр данных:

## A random data frame
df <- as.data.frame(rnorm(6))
names(df) <- "length"
## The edges in the "wrong" order
row.names(df) <- sample(1:6)

Вы можете правильно приписать строки, используя:

## Get the order of the edges
test_tree$edge.length <- df$length[sort(rownames(df))]

В этом случае сортировка довольно проста, поскольку имена ребер в df являются числовыми, но логика такова, что первый элемент в test_tree$edge.length должен быть длиной соединительного узла ребра 5к подсказке 1 и т. д. ...

Опять же, поскольку ваш пример не воспроизводим, трудно понять, что не так, но я бы сказал, что ваша df$length не правильная длина.

...