Я пытаюсь проанализировать некоторые файлы PDF, чтобы извлечь некоторую ключевую информацию. В каждом файле PDF есть количество таблиц, которые содержат часть этой информации.Поэтому я попытался использовать camelot для извлечения таблиц, и я получил хорошие результаты, но я хочу извлечь заголовок каждой таблицы, потому что я хочу сделать сопоставление для каждой таблицы с ее заголовком.Поэтому я попытался получить координаты каждой таблицы, используя tables[i]._bbox
, а затем добавить некоторое поле к этим координатам, чтобы определить область заголовка таблицы (она может быть вверху, слева или внизу таблицы) как показано на изображениях: название таблицы слева
название таблицы сверху
Может кто-нибудь сказать мне, какполучить координаты красной области, содержащей заголовок таблицы, из pdf на основе координат таблицы с использованием python?