Извлечение текста из раздела PDF с сохранением строк в одну строку - PullRequest
0 голосов
/ 16 сентября 2018

У меня есть несколько файлов PDF, и мне нужно извлечь из них некоторую информацию.«Раздел» имеет текст «Referências» и выглядит как на картинке ниже: enter image description here

Я пробовал много инструментов для извлечения текста, чтобы выполнить эту задачу, но проблема в том, чтоМне нужно, чтобы строка была в одной строке, я не знаю, смогу ли я объяснить это правильно, поэтому давайте рассмотрим пример:

Я не хочу этого: enter image description here Я хочу это: enter image description here

Надеюсь, вы понимаете, извините за английскую вещь.Большое спасибо.

...