Как провести PCA на транскриптомах пациента с несколькими факторами? - PullRequest
1 голос
/ 19 сентября 2019

Я хочу сделать корреляцию между выражением гена пациента / контроля в зависимости от возраста и продолжительности заболевания, но сначала хочу проанализировать, действительно ли это основные факторы, влияющие на экспрессию.Поэтому я хочу провести анализ для 6 факторов, которые могут внести свой вклад.Мне посоветовали использовать PCA, но я не уверен, является ли это правильным подходом.

Набор данных содержит транскриптом (~ 22000 генов) 12 пациентов и 10 контролей (всего 22) на двухместа отбора проб (двигательный нейрон / передний рог) (всего 44 образца).Он также указывает возраст, пол и длительность заболевания, а также место возникновения заболевания, если применимо.

Он структурирован следующим образом:

                                   ID SAMPLE TYPE    SEX    LOC  DUR AGE   A4GALT    A4GNT     AA06      AAAS     AACS   AACSP1      AADAC  AADACL2
X14_MN_SALS_Female_Bulbar_1.5_73  X14     MN SALS Female Bulbar 1.50  73 8.157744 7.596196 5.686725  9.005752 8.774661 8.017204  2.6187541 6.123113
X16_MN_SALS_Male_Arm_2.5_61       X16     MN SALS   Male    Arm 2.50  61 5.608782 6.614755 5.021643  8.132393 8.305636 7.382119  2.3007358 5.644822
X17_MN_SALS_Male_Arm_2_55         X17     MN SALS   Male    Arm 2.00  55 6.352859 6.476315 5.361992  9.149753 8.285859 7.195165  2.8611876 5.262565
X18_MN_SALS_Female_Bulbar_2_80    X18     MN SALS Female Bulbar 2.00  80 5.861249 5.974864 3.626572  9.004500 8.490199 7.265542 -0.9157199 5.169626
X27_MN_SALS_Male_Bulbar_3.25_74   X27     MN SALS   Male Bulbar 3.25  74 6.902205 8.026182 4.425676  9.041460 9.064080 7.960368  4.5344159 5.813113
X33_MN_SALS_Male_Arm_6.5_54       X33     MN SALS   Male    Arm 6.50  54 7.738372 6.438547 5.155050  9.802918 7.978966 7.506638  2.6833762 5.603203
X34_MN_SALS_Female_Bulbar_1_81    X34     MN SALS Female Bulbar 1.00  81 6.275111 7.075491 4.739286 10.928380 7.158841 7.559285  4.0588992 5.389785
X35_MN_SALS_Female_Bulbar_5.75_74 X35     MN SALS Female Bulbar 5.75  74 7.007736 6.715060 4.855120  8.858147 7.781114 7.433698  1.4305219 5.381327
X60_MN_SALS_Female_Bulbar_3_58    X60     MN SALS Female Bulbar 3.00  58 7.038836 7.043665 4.976014  8.998403 8.721243 7.572964  3.2686456 5.485040
X63_MN_SALS_Male_Arm_2.5_68       X63     MN SALS   Male    Arm 2.50  68 6.856041 7.354628 4.261617  7.101367 8.851444 7.892859  1.9685346 6.089073

С SAMPLE, TYPE, SEX и LOC, установленными на факторы, а затемцелые числа, можно запустить PCA.

Однако это приводит к тому, что пациенты и контроли рассматриваются как факторы (~ 22000 баллов из 44 факторов), а не фактические, которые я хочу включить в этот анализ (SAMPLE, TYPE, SEX, LOC, DUR, AGE).Есть ли способ проанализировать данные экспрессии генов с использованием этих факторов?

1 Ответ

0 голосов
/ 24 сентября 2019

Пакет PCAmixdata может на самом деле быть тем, что вы ищете, точнее, функцией PCAmix()

Выполняет анализ основных компонентов для группы лиц (наблюдения)описывается смесью качественных и количественных переменных.PCAmix включает в себя обычный анализ основных компонентов (PCA) и анализ множественной корреспонденции (MCA) в качестве особых случаев.

Минимальный рабочий пример вы найдете по адресу https://cran.r -project.org / web / packages / PCAmixdata / vignettes / PCAmixdata.html # graphic-output

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...