Question

Я пытаюсь проанализировать некоторые файлы PDF, чтобы извлечь некоторую ключевую информацию. В каждом файле PDF есть количество таблиц, которые содержат часть этой информации.Поэтому я попытался использовать camelot для извлечения таблиц, и я получил хорошие результаты, но я хочу извлечь заголовок каждой таблицы, потому что я хочу сделать сопоставление для каждой таблицы с ее заголовком.Поэтому я попытался получить координаты каждой таблицы, используя tables[i]._bbox, а затем добавить некоторое поле к этим координатам, чтобы определить область заголовка таблицы (она может быть вверху, слева или внизу таблицы) как показано на изображениях: название таблицы слева

название таблицы сверху

Может кто-нибудь сказать мне, какполучить координаты красной области, содержащей заголовок таблицы, из pdf на основе координат таблицы с использованием python?

Как получить координаты таблицы с помощью python-camelot?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как получить координаты таблицы с помощью python-camelot?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы