Как записать Mesh из PubMed во фрейм данных - PullRequest
0 голосов
/ 24 ноября 2018

Я недавно загрузил пакет RISmed , чтобы загрузить чуть менее 500 000 рефератов статей из PubMed, и я пытаюсь ввести эти данные во фрейм данных.Моя проблема возникает при попытке включить данные Mesh, я получаю сообщение об ошибке

'Ошибка в (function (..., row.names = NULL, check.rows = FALSE, check.names =ИСТИНА: аргументы подразумевают различное количество строк: '

Есть ли способ вложить эту информацию во фрейм данных для анализа?

RCT_topic <- 'randomized clinical trial'
RCT_query <- EUtilsSummary(RCT_topic, mindate=2016, maxdate=2017, retmax=100)
summary(RCT_query)
RCT_records <- EUtilsGet(RCT_query)

RCT_data <- data.frame('PMID'=PMID(RCT_records), 
                       'Title'=ArticleTitle(RCT_records), 
                       'Abstract'=AbstractText(RCT_records), 
                       'YearPublished'=YearPubmed(RCT_records), 
                       'Month.Published'=MonthPubmed(RCT_records), 
                       'Country'=Country(RCT_records), 
                       'Grant'=GrantID(RCT_records), 
                       'Acronym'=Acronym(RCT_records), 
                       'Agency'=Agency(RCT_records),
                       'Mesh'=Mesh(RCT_records))

1 Ответ

0 голосов
/ 24 ноября 2018

Рассмотрите возможность использования tibble :

library(RISmed)
library(dplyr) # tibble and other functions

RCT_topic <- 'randomized clinical trial'
RCT_query <- EUtilsSummary(RCT_topic, mindate=2016, maxdate=2017, retmax=100)
summary(RCT_query)
RCT_records <- EUtilsGet(RCT_query)

RCT_data <- data_frame('PMID'=PMID(RCT_records),
                       'Title'=ArticleTitle(RCT_records),
                       'Abstract'=AbstractText(RCT_records),
                       'YearPublished'=YearPubmed(RCT_records),
                       'Month.Published'=MonthPubmed(RCT_records),
                       'Country'= Country(RCT_records),
                       'Grant' =GrantID(RCT_records),
                       'Acronym' =Acronym(RCT_records),
                       'Agency' =Agency(RCT_records),
                       'Mesh'=Mesh(RCT_records))

Столбец Mesh теперь представляет собой список фреймов данных:

select(RCT_data, PMID, Mesh)
# # A tibble: 100 x 2
#    PMID     Mesh                 
#    <chr>    <list>               
#  1 29288775 <data.frame [21 × 2]>
#  2 29288545 <data.frame [19 × 2]>
#  3 29288510 <data.frame [15 × 2]>
#  4 29288507 <data.frame [19 × 2]>
#  5 29288478 <data.frame [16 × 2]>
#  6 29288309 <data.frame [19 × 2]>
#  7 29288191 <data.frame [11 × 2]>
#  8 29288190 <data.frame [23 × 2]>
#  9 29288184 <data.frame [21 × 2]>
# 10 29288175 <data.frame [12 × 2]>
# # ... with 90 more rows
...