Удалить пробел из PDF документа - PullRequest
0 голосов
/ 28 января 2019

Я использую Camelot-py для чтения и извлечения атрибутов из нескольких PDF-файлов.Я использую table_areas для извлечения некоторых атрибутов, и я сталкиваюсь с трудностями при настройке правильных областей из-за отклонения координат X или Y между некоторыми формами.Некоторые формы (образец 1) имеют минимальные пробелы вверху, в то время как другие (образец 2) имеют больше пробелов.Это смещает координаты y примерно на 10-15

Образец 1 enter image description here

Образец 2 enter image description here

Есть ли способ обрезать или унифицировать их во время выполнения?

1 Ответ

0 голосов
/ 29 января 2019

Я думаю, что решение использует параметр table_regions, как указано в Найти размеры PDF с помощью Camelot .

Подробнее о table_regions см. В: https://camelot -py.readthedocs.-й / о / мастер / пользователь / advanced.html # указать сТОЛ-регионы

...