Я получил координаты ограничивающего прямоугольника таблицы, используя Camelot
, но мне нужно использовать tabula-py
для извлечения данных таблицы, поскольку camelot извлекает только первую строку в каждой ячейке таблицы, даже в режиме решетки.Я заметил, что при определении одной и той же области таблицы в tabula-py 2 из полученных координат в значительной степени отличаются от значений camelot (показано в примере кода ниже).В то время как 2-е и 4-е значения в таблице похожи на 1-е и третье значения в Camelot, остальные в значительной степени отличаются, как я могу перевести эти показания из значений Camelot, пожалуйста?Я пытался использовать пропорции, а также складывать и вычитать значения, но все было напрасно ...
df= tabula.read_pdf(pdf_path, lattice=True, area=(71, 627, 325, 1160), pages=page)
, но значения координат camelot из bbox: 631, 518, 1154, 765