Можно ли определить количество столбцов текста в PDF-файле с python? - PullRequest
0 голосов
/ 03 июня 2019

Мне дали группу PDF-файлов, которые все были отформатированы по-разному, некоторые с одним столбцом, некоторые с двумя столбцами и даже некоторые с тремя столбцами.

Можно ли использовать python для определения количества столбцов в файле PDF? Или способ категоризации файлов по количеству столбцов?

Я очень новичок в этой задаче, и любая помощь / предложения будут с благодарностью.

1 Ответ

0 голосов
/ 03 июня 2019

Существует модуль pdftotree , который делает эту вещь.

Вы можете проверить другие вопросы в: Преобразование pdf в text / html в python, чтобы я мог его проанализировать

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...