Извлечение данных из PDF в CSV с помощью R - PullRequest
0 голосов
/ 19 сентября 2019

Я использовал этот код для извлечения данных из моего PDF:

tx <- pdf_text("Name.pdf")
tx2 <- unlist(str_split(tx, "[\\r\\n]+"))
tx3 <- str_split_fixed(str_trim(tx2), "\\s{2,}", 5)
write.csv(tx3, file="Path\\ds1.csv")

Но при этом для разделения PDF используется конец строки.Я хочу отделить после каждого абзаца.Есть ли какая-нибудь другая функция разбиения, которую я могу использовать, чтобы получить данные по параграфу?

...