Как переключить координаты области таблицы в Python Camelot и Tabula-Py - PullRequest
3 голосов
/ 08 мая 2019

Я получил координаты ограничивающего прямоугольника таблицы, используя Camelot, но мне нужно использовать tabula-py для извлечения данных таблицы, поскольку camelot извлекает только первую строку в каждой ячейке таблицы, даже в режиме решетки.Я заметил, что при определении одной и той же области таблицы в tabula-py 2 из полученных координат в значительной степени отличаются от значений camelot (показано в примере кода ниже).В то время как 2-е и 4-е значения в таблице похожи на 1-е и третье значения в Camelot, остальные в значительной степени отличаются, как я могу перевести эти показания из значений Camelot, пожалуйста?Я пытался использовать пропорции, а также складывать и вычитать значения, но все было напрасно ...

df= tabula.read_pdf(pdf_path, lattice=True, area=(71, 627, 325, 1160), pages=page)

, но значения координат camelot из bbox: 631, 518, 1154, 765

...