Я пытаюсь извлечь финансовые данные из отчетности.У меня есть Excel, полученный из конвертированного сканирования, где каждый лист представляет страницу из финансовой отчетности.Я преобразовал его в список, где каждый тиббл является страницей.Теперь я хочу отфильтровать его по наличию конкретной строки, например «КОНСОЛИДИРОВАННОЕ ЗАЯВЛЕНИЕ ФИНАНСОВОГО ПОЛОЖЕНИЯ» или «КОНСОЛИДИРОВАННОЕ ЗАЯВЛЕНИЕ ФИНАНСОВОГО ПОЛОЖЕНИЯ (продолжение)».В результате я хочу получить список только с балансами, а затем объединить его по горизонтали.Примечание: эта строка будет в пределах 10 ячеек сверху (как заголовок).
mysheets_fromexcel <- list()
mysheetlist <- excel_sheets("file.xlsx")
i=1
for (i in 1:length(mysheetlist)){
tempdf <- read_excel("file.xlsx", sheet = mysheetlist[i])
mysheets_fromexcel[[i]] <- tempdf
}
mysheets_fromexcel[[11]]