Я использую tidyverse, tidytext и pdftools. Я хочу разобрать слова в каталоге из 70 файлов PDF. Я использую эти инструменты, чтобы сделать это успешно, но код ниже захватывает все страницы вместо подмножества, которое я хочу. Мне нужно пропустить первые две страницы и выбрать страницу 3 до конца файла для каждого файла PDF.
directory <- "Student_Artifacts/"
pdfs <- paste(directory, "/", list.files(directory, pattern = "*.pdf"), sep = "")
pdf_names <- list.files(directory, pattern = "*.pdf")
pdfs_text <- map(pdfs, (pdf_text))
my_data <- data_frame(document = pdf_names, text = pdfs_text)
Я понял, что, поместив [3:12] в такие скобки, я могу взять документы с 3 по 12:
pdfs_text <- map(pdfs, (pdf_text))[3:12]
Это не то, что я хочу. Как использовать спецификацию [3:12] для извлечения нужных мне страниц из каждого файла PDF?