Я хочу разделить документ PDF на основе размера шрифта, но я не могу найти библиотеку, которая будет извлекать как размер шрифта, так и разделение.
https://github.com/jsvine/pdfplumber может извлечьинформация, такая как размер шрифта, местоположение символа.
pyPdf может разделить документ PDF и сохранить в другой файл PDF, если указаны координаты, но нет механизма для извлечения размера шрифта и других функций.
Я пытался использовать их вместе, норасположение символов, заданных pdfplumber, отличается от координат, используемых pyPdf.Вот почему я получаю неожиданный вывод.
Есть ли какая-либо библиотека в Python, которая будет делать и то и другое?или я могу использовать местоположение, предоставленное pdfplumber в pypdf?