Как организовать данные для ComBat в R - PullRequest
0 голосов
/ 04 июля 2019

Я работаю в консоли R и пытаюсь использовать функцию ComBat из пакета sva.Тем не менее, после запуска функции, я получаю эту ошибку.

Ошибка в solve.default (crossprod (des), crossprod (des, y1)): Подпрограмма Lapack dgesv: система точно в единственном числе:U [1,1] = 0

После осмотра я обнаружил, что эта ошибка как-то связана с тем, как организованы данные.Проблема в том, что я не могу найти места, где говорится, как должны быть организованы данные.Кто-нибудь знает, как его настроить?

Я пытался реорганизовать данные в разных форматах.Я заменил все 0 значений на NA.Текущий формат имеет образцы идентификаторов в первой строке с данными нормализованной экспрессии генов в.Другой файл, выражение фенотипа, имеет идентификаторы образцов в первой строке, а фенотип выражен как 1 да и 2 нет.Но все равно происходит сбой с той же ошибкой.

В консоли R я ввел эти команды.

#to install packages: 
if (!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")
BiocManager::install()
#select "yes" and update all
BiocManager::install(c("GenomicFeatures", "AnnotationDbi"))
#select "yes" and update all
BiocManager::install(c("limma","sva","pamr"))
#select "yes" and update all

#to load the previously installed packages:
library(sva)
library (pamr)
library(limma)

#setting up the data
mydata = read.csv("54samplescsv.csv" , sep = "," , header = TRUE)
#gene expression file
pheno = read.csv("pheno_R.csv" , sep = "," , header = TRUE)
#phenotype file
mydata[mydata == 0] <- NA
mod = model.matrix(~1 , data = pheno)

#executing ComBat
newdata = ComBat(dat = myData , batch = pheno$Batch , par.prior = TRUE , mod = mod)

#error occurs
Error in solve.default(crossprod(des), crossprod(des, y1)) : 
  Lapack routine dgesv: system is exactly singular: U[1,1] = 0

Ожидаемый вывод:

Found2batches Настройка for0covariate (s) или уровень (уровни) ковариации. Стандартизация данных по генам. Подбор модели L / S и поиск априорных значений. Поиск параметрических корректировок. Настройка данных.Стандартизация данных по генам Ошибка в solve.default (crossprod (des), crossprod (des, y1)): подпрограмма Лапака dgesv: система точно сингулярна: U [1,1] = 0

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...