R: Используйте Regex для импорта листов Specifi c из нескольких файлов Excel - PullRequest
1 голос
/ 19 апреля 2020

У меня есть группа файлов Excel с несколькими листами, которые не соответствуют стандартному соглашению об именах. Я хочу создать один фрейм данных из указанных c листов, содержащих ключевое слово 'frame' .

library(tidyverse)
library(openxlsx)

# Sample Excel File 1
df1 <- data.frame(replicate(10,sample(0:1,10,rep=TRUE)))
data_frame2 <- data.frame(replicate(10,sample(0:1,10,rep=TRUE)))
list_of_datasets1 <- list("df" = df1, "date_frame" = data_frame2)
write.xlsx(list_of_datasets1, file = "writeXLSX1.xlsx")

# Sample Excel File 2
df3 <- data.frame(replicate(10,sample(0:1,10,rep=TRUE)))
data_frame4 <- data.frame(replicate(10,sample(0:1,10,rep=TRUE)))
list_of_datasets2 <- list("date_frames" = df3, "dfs" = data_frame4)
write.xlsx(list_of_datasets2, file = "writeXLSX2.xlsx")

# Create List of Excel Files
excel_file_list <- list.files(pattern = "writeXLSX\\d*.xlsx", full.names = T)

Я бы хотел сделать это с помощью регулярного выражения с purr вот так:

df_bind <- excel_file_list %>%
  map_dfr(~read_excel(.x, sheet = grepl("frame", .x)))

Ближайший ответ Я обнаружил, что отлично работает с одним файлом. Однако я не могу понять, как правильно извлекать имена листов, когда они в списке.

1 Ответ

1 голос
/ 19 апреля 2020

Мы можем использовать str_detect

library(readxl)
library(dplyr)
library(purrr)
excel_file_list %>% 
      map_dfr(~ read_excel(.x, sheet = which(str_detect(excel_sheets(.x), 'frame'))))
...