Я хочу сделать корреляцию между выражением гена пациента / контроля в зависимости от возраста и продолжительности заболевания, но сначала хочу проанализировать, действительно ли это основные факторы, влияющие на экспрессию.Поэтому я хочу провести анализ для 6 факторов, которые могут внести свой вклад.Мне посоветовали использовать PCA, но я не уверен, является ли это правильным подходом.
Набор данных содержит транскриптом (~ 22000 генов) 12 пациентов и 10 контролей (всего 22) на двухместа отбора проб (двигательный нейрон / передний рог) (всего 44 образца).Он также указывает возраст, пол и длительность заболевания, а также место возникновения заболевания, если применимо.
Он структурирован следующим образом:
ID SAMPLE TYPE SEX LOC DUR AGE A4GALT A4GNT AA06 AAAS AACS AACSP1 AADAC AADACL2
X14_MN_SALS_Female_Bulbar_1.5_73 X14 MN SALS Female Bulbar 1.50 73 8.157744 7.596196 5.686725 9.005752 8.774661 8.017204 2.6187541 6.123113
X16_MN_SALS_Male_Arm_2.5_61 X16 MN SALS Male Arm 2.50 61 5.608782 6.614755 5.021643 8.132393 8.305636 7.382119 2.3007358 5.644822
X17_MN_SALS_Male_Arm_2_55 X17 MN SALS Male Arm 2.00 55 6.352859 6.476315 5.361992 9.149753 8.285859 7.195165 2.8611876 5.262565
X18_MN_SALS_Female_Bulbar_2_80 X18 MN SALS Female Bulbar 2.00 80 5.861249 5.974864 3.626572 9.004500 8.490199 7.265542 -0.9157199 5.169626
X27_MN_SALS_Male_Bulbar_3.25_74 X27 MN SALS Male Bulbar 3.25 74 6.902205 8.026182 4.425676 9.041460 9.064080 7.960368 4.5344159 5.813113
X33_MN_SALS_Male_Arm_6.5_54 X33 MN SALS Male Arm 6.50 54 7.738372 6.438547 5.155050 9.802918 7.978966 7.506638 2.6833762 5.603203
X34_MN_SALS_Female_Bulbar_1_81 X34 MN SALS Female Bulbar 1.00 81 6.275111 7.075491 4.739286 10.928380 7.158841 7.559285 4.0588992 5.389785
X35_MN_SALS_Female_Bulbar_5.75_74 X35 MN SALS Female Bulbar 5.75 74 7.007736 6.715060 4.855120 8.858147 7.781114 7.433698 1.4305219 5.381327
X60_MN_SALS_Female_Bulbar_3_58 X60 MN SALS Female Bulbar 3.00 58 7.038836 7.043665 4.976014 8.998403 8.721243 7.572964 3.2686456 5.485040
X63_MN_SALS_Male_Arm_2.5_68 X63 MN SALS Male Arm 2.50 68 6.856041 7.354628 4.261617 7.101367 8.851444 7.892859 1.9685346 6.089073
С SAMPLE, TYPE, SEX и LOC, установленными на факторы, а затемцелые числа, можно запустить PCA.
Однако это приводит к тому, что пациенты и контроли рассматриваются как факторы (~ 22000 баллов из 44 факторов), а не фактические, которые я хочу включить в этот анализ (SAMPLE, TYPE, SEX, LOC, DUR, AGE).Есть ли способ проанализировать данные экспрессии генов с использованием этих факторов?