Импорт листов из файлов Excel, расположенных в другой папке в R - PullRequest
0 голосов
/ 06 февраля 2019

В основном у меня есть два файла Excel с одним и тем же именем «Контрольный список» в двух разных папках (один - 2018, а другой - 2019).Контрольный список содержит разные листы, по одному на каждый месяц: «Январь», «Февраль» и т. Д. Конечно, все листы имеют одинаковые переменные.Я хотел бы поместить в один фрейм данных все листы из обоих файлов Excel.Пока я могу собрать листы из одного файла Excel с помощью:

library(readxl)   
library(tibble)
read_excel_allsheets <- function(filename, tibble = TRUE) {
  sheets <- readxl::excel_sheets(filename)
  x <- lapply(sheets, function(X) readxl::read_excel(filename, sheet = X))
  if(!tibble) x <- lapply(x, as.data.frame)
  names(x) <- sheets
  x
}

mysheets <-read_excel_allsheets("C:/Users/Thiphaine/Documents/2018/Checklist.xlsx")
library(dplyr)
mysheets<-bind_rows(mysheets, .id = "column_label")

Я просто не знаю, как создать цикл, который будет проходить через папки 2018 и 2019, чтобы собрать все листы из обоихФайл Excel.Идея также будет состоять в том, что в 2020 году у меня будет еще одна папка «2020», которая должна быть включена ... Есть идеи?Спасибо

Ответы [ 2 ]

0 голосов
/ 06 февраля 2019

Если вы хотите, можете также векторизовать его, используя подход tidyverse.Тем более, что все ваши файлы одинаковы (имена столбцов), и вы хотите получить data.frame.

require(tidyverse)

df <- list.files(path = "your_path",
                       full.names = TRUE,
                       recursive = TRUE,
                       pattern = "*.xls") %>% 
tbl_df() %>%
mutate(sheetName = map(value, readxl::excel_sheets)) %>%
unnest(sheetName) %>% 
mutate(myFiles = purrr::map2(value, sheetName, function(x,y) {
    readxl::read_excel(x, sheet = paste(y))})) %>% 
unnest(myFiles)
0 голосов
/ 06 февраля 2019

Попробуйте:

library(dplyr)
allsheets <- list()
for(file in list.files(path = "PATH/TO/DCUMENTS/", 
    recursive = TRUE, pattern = "*.xlsx", full.names = TRUE)) {
  mysheets <- read_excel_allsheets(file)
  mysheets <- bind_rows(mysheets, .id = "column_label") 
  allsheets[[file]] <- mysheets
}

, где PATH/TO/DOCUMENTS для вас, вероятно, что-то вроде "C:/Users/Thiphaine/Documents/.

...