Переименование строк в соответствии с отдельным индексом - PullRequest
0 голосов
/ 12 мая 2018

В настоящее время я работаю с матрицей, которая выглядит следующим образом:

gene ID    untreated_1 merb_2h_1 merb_4h_1 merb_8h_1
1            2.961344  2.656308  3.322758  3.201053
100          3.998061  3.860054  3.934714  3.069164
1000         8.987753  9.125033  9.220713  9.141715
10000        8.165543  7.973907  7.472961  7.361228
10001       4.8865396  4.641879  4.523251  3.411761
100033431   0.5847026  1.347103  1.203390  1.550687

Я хотел бы изменить столбец идентификатора гена на его эквивалентное имя в номенклатуре hgnc, которую я уже перечислил в генетаблица аннотаций ниже:

       gene ensembl_gene_id hgnc_symbol
1         1 ENSG00000121410 A1BG
2        10 ENSG00000156006 NAT2 
3       100 ENSG00000196839 ADA  
4      1000 ENSG00000170558 CDH2 
5     10000 ENSG00000117020 AKT3
6 100008586 ENSG00000224659 GAGE12J 
7 100009676 ENSG00000256628 ZBTB11-AS1 

Обратите внимание, что в матрице, с которой я работаю, присутствуют только некоторые гены таблицы аннотаций.Мой вопрос заключается в том, как переименовать столбец идентификатора гена из матрицы, с которой я работаю, с помощью номенклатуры hgnc, которую я имею в отдельном списке аннотаций гена.Я работаю с действительно большой матрицей, поэтому мне нужно параллельное задание.

1 Ответ

0 голосов
/ 12 мая 2018
df1$geneID <- df2$hgnc_symbol[match(df1$geneID,df2$gene)]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...