Как уменьшить мой набор данных, чтобы построить его с помощью igraph? - PullRequest
0 голосов
/ 04 июня 2019

У меня есть набор данных с корреляциями между генами и OTU.Я хочу построить эти корреляции с библиотекой igraph в R, чтобы узнать, какие гены связаны с каким OTU.Затем я извлеку различные компоненты (каждый компонент должен представлять геном).

Мой набор данных очень большой: я не могу сохранить все корреляции (в диапазоне [-1,1]), чтодает огромный набор данных (817.000 * 817.000 корреляций).Итак, я хочу выбрать порог: есть ли хороший способ установить хороший порог?Я имею в виду, если я сохраню корреляции> 0,9, это имеет смысл?Если я сделаю это, я сохраню более 58 миллионов корреляций.

Еще один момент - узнать, должен ли я сохранять только корреляции OTU-гена?Все еще имеет смысл сохранять корреляции OTU-OTU и гена-гена?Если я сохраню корреляции OTU-гена> 0,8, я сохраню более 1,1 миллиона корреляций.

Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...