Pdfminer.six Python имеет некоторые проблемы соскребания - PullRequest
0 голосов
/ 20 марта 2019

Я работаю над Python pdfminer.six, который изначально отлично работал для меня, но теперь у меня есть PDF, который содержит данные в виде строки всей страницы и по 4 столбца на страницу, в то время как данные на основе столбцов иногда очищаются, а данные, представленные во втором столбце, удаляются.раньше, чем данные в первом столбце.Если у кого есть решение, пожалуйста, поделитесь.

...