Борьба с форматированием результатов совмещения данных для анализа сети с igraph в R - PullRequest
0 голосов
/ 20 сентября 2019

Я провел совместный анализ по генам микробиологических таксонов и устойчивости к антибиотикам, вдохновленный этой статьей: https://doi.org/10.1016/j.watres.2018.12.034. Я успешно провел анализ с использованием функции rcorr из пакета Hmisc.данные ampC: https://drive.google.com/open?id=1WMCtFcavDerdiQMNuvlX9-7prns9xDYH данные о видах: https://drive.google.com/open?id=10Sh2rD8ZzFTn1xrL5YRHo6N1H3WMmuqV Я использовал таблицы x, представляющие переменные вида и y параметры окружающей среды, в данном случае гены устойчивости к антибиотикам.

x <- as.matrix(x)
y <- as.matrix(y)
rcorr_result <- rcorr(x,y, type = "spearman")

С этого момента я хочу использовать матрицу корреляции значения rho для создания сети, чтобы проиллюстрировать совместные вхождения между типами и ARG с помощью пакета igraph.Проблема в том, что я не уверен, в каком формате данные должны быть репрезентативными для фактических корреляций.Я выбрал два подхода:
1.

result <- rcorr_result$r
graph <- graph_from_data_frame(result, directed = FALSE)
plot(graph)

Он создает сеть, которая является круглой и не указывает на большое количество взаимодействий.enter image description here

Второй метод заключался в извлечении взаимодействий, которые указывали на высокую встречаемость, то есть значения rho >0.6 / <-0.6.Это создает фрейм данных другого типа и создает совершенно другую сеть.2.

data = which(abs(rcorr_result$r) > 0.6 & lower.tri(rcorr_result$r),arr.ind=TRUE)
graph <- graph_from_data_frame(data)
plot(graph, vertex.label=names)

enter image description here

Поэтому мне нужно понять, какой правильный формат использовать при проведении этих анализов?Кроме того, это миссия, назначающая цвета видам и ARG для узлов и других эстетических вещей.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...