Есть ли код R, установленный для использования PubMed ID или DOI для получения файлов данных для этой статьи, пожалуйста? - PullRequest
2 голосов
/ 28 марта 2019

Я пытаюсь получить имена файлов данных из NCBI или PubMed, которые связаны или присоединены к сотням уникальных DOI или PMID на языке R.Например.У меня есть PMID: 19122651, и я хочу получить имена трех подключенных к нему GSE: GSE12781, GSE12782 и GSE12783.Я искал различные источники и пакеты безрезультатно.
Благодарим Вас за помощь.

Ответы [ 2 ]

4 голосов
/ 28 марта 2019

Вы можете сделать это, используя пакет rentrez .

Требуемая функция: entrez_link .

Пример:

library(rentrez)

results <- entrez_link(dbfrom = 'pubmed', id = 19122651, db = 'gds')

results$links$pubmed_gds
[1] "200012783" "200012782" "200012781"

3 результата - это идентификаторы для связанных записей набора данных GEO. Вы можете конвертировать их в образцы GSE, используя entrez_summary.

Вот несколько уродливый sapply, который может служить основой для функции:

sapply(results$links$pubmed_gds, function (id) entrez_summary("gds", id)$accession, 
       USE.NAMES = FALSE)

[1] "GSE12783" "GSE12782" "GSE12781"
1 голос
/ 28 марта 2019

Вы можете запросить NCBI через пакет rentrez, как описано здесь . Функция entrez_link() должна уметь находить перекрестные ссылки

...