Question

Я использовал этот код для извлечения данных из моего PDF:

tx <- pdf_text("Name.pdf")
tx2 <- unlist(str_split(tx, "[\\r\\n]+"))
tx3 <- str_split_fixed(str_trim(tx2), "\\s{2,}", 5)
write.csv(tx3, file="Path\\ds1.csv")

Но при этом для разделения PDF используется конец строки.Я хочу отделить после каждого абзаца.Есть ли какая-нибудь другая функция разбиения, которую я могу использовать, чтобы получить данные по параграфу?

Извлечение данных из PDF в CSV с помощью R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Извлечение данных из PDF в CSV с помощью R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы