Как использовать fastICA в R для независимого анализа компонентов и построения графиков - PullRequest
0 голосов
/ 29 октября 2019

У меня есть набор данных с генами в виде строк (87 560) и образцов в виде столбцов (всего 20 образцов: 10 раковых и 10 нормальных). Я пытаюсь сделать две вещи:

Во-первых, я хочу использовать ICA (анализ независимых компонентов) с fastICA в R. Я следовал указаниям в справочнике функций, пытался реализовать его для транспонированиямоя матрица, но я получаю сообщение об ошибке «Ошибка: невозможно выделить вектор размером 22,3 ГБ». Не уверен, что я делаю не так? Если я запускаю fastICA на своей матрице данных как есть (с генами в виде строк и выборок в виде столбцов), без транспонирования, это работает, но из описания fastICA я понимаю, что переменные (гены) должны иметь столбцы и образцыв виде строк?

Во-вторых, я хочу построить 20 образцов для первых двух компонентов с разными цветами, чтобы отобразить разницу между двумя группами (то есть красным для образцов рака и зеленым для нормального)

Это код, который я использовал:

ind_comp <- fastICA(t(data),20, alg.typ = "parallel", fun = "logcosh", alpha = 1, 
             method = "R", row.norm = FALSE, maxit = 200, 
             tol = 0.0001, verbose = TRUE)

summary(ind_comp)
par(mfrow = c(1, 3))
plot(ind_comp$X, main = "Pre-processed data")
plot(ind_comp$X %*% ind_comp$K, main = "PCA components")
plot(ind_comp$S, main = "ICA components")

Есть ли у кого-нибудь какие-либо предложения о том, как внедрить fastICA в мои данные, а затем построить 20 образцов с разными цветами, как уже упоминалось?

...