У меня есть набор данных с корреляциями между генами и OTU.Я хочу построить эти корреляции с библиотекой igraph в R, чтобы узнать, какие гены связаны с каким OTU.Затем я извлеку различные компоненты (каждый компонент должен представлять геном).
Мой набор данных очень большой: я не могу сохранить все корреляции (в диапазоне [-1,1]), чтодает огромный набор данных (817.000 * 817.000 корреляций).Итак, я хочу выбрать порог: есть ли хороший способ установить хороший порог?Я имею в виду, если я сохраню корреляции> 0,9, это имеет смысл?Если я сделаю это, я сохраню более 58 миллионов корреляций.
Еще один момент - узнать, должен ли я сохранять только корреляции OTU-гена?Все еще имеет смысл сохранять корреляции OTU-OTU и гена-гена?Если я сохраню корреляции OTU-гена> 0,8, я сохраню более 1,1 миллиона корреляций.
Спасибо