Я извлек из некоторых текстов информацию о генах и хромосомах в объекте, чтобы классифицировать базу данных некоторых текстов.
мой результат пропустил некоторые данные; на самом деле некоторые тексты могут содержать только the gene name and the location
, и я хочу получить omim number, the gene symbol, the gene name, and the chromosome location
это часть моих результатов (с использованием Rcode)
OMIM GENES_SYMBOL GENES CHROMOSOME
1 (NA) (arlts1) (NA) (NA)
2 (NA) (mtr) (NA) (NA)
3 (NA) (hla.g) (NA) (NA)
4 (NA) (nat2, t341c) (NA) (NA)
5 (222300) (wfs1) (NA) (X4p16)
Я хочу избавиться от NA: замените каждый эквивалентным nae или кодом; например, что-то, что занимает arlts1
и находит указанное число omim, имя гена и местоположение хромосомы.
Я много искал, но не смог найти исчерпывающую базу данных, которая содержит всю информацию
Может быть, я смогу сделать это с biomart
? Я даже не знаю что это
Может ли кто-нибудь помочь мне с некоторыми решениями моей проблемы?