Могу ли я использовать biomart для сопоставления названий генов, чисел omim и местоположений хромосом? - PullRequest
0 голосов
/ 27 августа 2018

Я извлек из некоторых текстов информацию о генах и хромосомах в объекте, чтобы классифицировать базу данных некоторых текстов.

мой результат пропустил некоторые данные; на самом деле некоторые тексты могут содержать только the gene name and the location, и я хочу получить omim number, the gene symbol, the gene name, and the chromosome location

это часть моих результатов (с использованием Rcode)

       OMIM   GENES_SYMBOL         GENES        CHROMOSOME
1      (NA)       (arlts1)         (NA)              (NA)
2      (NA)          (mtr)          (NA)              (NA)
3      (NA)        (hla.g)          (NA)              (NA)
4      (NA)  (nat2, t341c)          (NA)              (NA)
5  (222300)         (wfs1)          (NA)            (X4p16)

Я хочу избавиться от NA: замените каждый эквивалентным nae или кодом; например, что-то, что занимает arlts1 и находит указанное число omim, имя гена и местоположение хромосомы.

Я много искал, но не смог найти исчерпывающую базу данных, которая содержит всю информацию

Может быть, я смогу сделать это с biomart? Я даже не знаю что это Может ли кто-нибудь помочь мне с некоторыми решениями моей проблемы?

...