Что проще?Слияние или индикатор переменных? - PullRequest
1 голос
/ 27 июля 2011

У меня есть два набора данных, которые я хотел бы исследовать.Первый - это данные, связанные с геном / геномом, которые имеют разные «клеточные состояния».Второй набор данных связывает гены с биологическим путем.Я верю мой вопрос - реляционный дБ один.«Как я могу показать данные, относящиеся к одному фрейму данных, и связать их с другим.Другими словами, я хочу построить график данных о состоянии клеток и связать их с путями и их конкретными генами. (я думаю, что в картинках так здесь.) dataframe1 - данные с генного чипа affymetrix ген, клетка-состояние1, клетка-состояние2 ...ген1, х1, у1, ...ген2, х2, у2, ...gene.x, ... ... "1""ген" "log_b" "log_b_rich" "Fc_cdt_rich_tot" "fc_Etoh_CDT_tot_mono" "fc_Etoh_CDT_tot_poly" "fc_Etoh_CDT_mono_poly" "fc_Etoh_Rich_tot_mono" "fc_Etoh_Rich_tot_poly" "fc_Etoh_Rich_mono_poly" "2" "PHF13" -2,712616698 -1,47923545 -0,791138043 -0,549610558 0,143808182 0,69341874 0,320812876 1,089260116 0,76844724 "3""SPSB1" -1.808348454 -1,965601198 -1,349135752 -0,780105329 0,410647447 1,190752776 0,587287796 1,260350195 0,673062399 dataframe2 - данные из базы данных kegg путь1, ген-x1, ген-x2, ...путь2, ген-у1, ген-у2, ...pathway3, gene-z1, ... "1""KEGG_GLYCOLYSIS_GLUCONEOGENESIS" "PHF13""LDHB" "LDHA" "PGAM1" "ADH1C" "PGAM2" "ADH1B" "ADH1A" "ACSS2" "PDHB" "ACSS1"" PGAM4 "" PDHA2 "" PDHA1 "" LDHAL6B "" PFKL "" LDHAL6A "" FBP1 "" PFKP "" ALDH3B2 "" FBP2 "" PFKM "" ALDH3B1 "" PGM2 "" G6PC "" ALDH7A1 "ALDH7A1 "1PKM2 "" PGM1 "" DLD "" PKLR "" ALDH9A1 "" ALDOA "" ALDOC "" ALDOB "" ADH5 "" HK2 "" HK1 "" ADH6 "" ADH7 "" ALDH3A2 "" G6PC2 "" ALDH3A1 "" GALM ""TPI1" "AKR1A1" "ADH4" "HK3" "ALDH1A3" "ENO2" "ENO3" "GAPDH" "ENO1" "BPGM" "DLAT" "PCK2" "PCK1" "GPI" "GCK" "ALDH2" "PGK1"" PGK2 "
" 2 "" KEGG_CITRATE_CYCLE_TCA_CYCLE "" PHF13 "" OGDHL "" OGDH "" PDHB "" IDH3G "" LOC283398 "" IDH2 "" IDH1 ""H1PDHA2 "" PDHA1 "" SUCLA2 "" FH "" DLST "" ACO2 "" SUCLG2 "" ACO1 " «PHF13» подсвечивается, чтобы показать релевантность на каждом шаге.То, что я хочу сделать, это посмотреть, активирует ли «cell-state1» (in-) разные гены / пути от «cell-state2».Кроме того, я хотел бы проверить корреляцию (t-критерий и, возможно, построение графиков) между состояниями ячеек 1 Vs 2 для конкретных путей.У меня вопрос, какие команды или методы позволят мне сделать это наиболее легко / эффективно: merge или использование фиктивная переменная ?НТН

1 Ответ

0 голосов
/ 27 июля 2011

Что я хочу сделать, это посмотреть, активирует ли «cell-state1» (in-) пути различных генов из «cell-state2»

Звучит так, как будто вам нужен факторный анализ. Вы можете спросить об этом хороших людей из statistics.stackexchange.com .

...