В любом случае я могу прочитать весь текст из каждой строки в PDF, только текст, который начинается с левой координаты 144.0 в python - PullRequest
0 голосов
/ 19 июня 2020

В моем случае я хочу прочитать текст из PDF. Единственный текст, который начинается с 144.0 левой координаты. Проверяя каждую строку в pdf ... если текст находится в левой координате 144.0, тогда python должен выбрать строку, присутствующую в этом подобном. Если текст найден перед левой координатой 144.0 ИЛИ после координаты 144.0, он должен пропустить строку и проверить то же самое в следующей строке.

Прямо сейчас я использую приведенный ниже код, но он работает для определенной области и он выбирает данные, присутствующие в этой области .. но я специально хочу, чтобы он выбирал только текст и только если текст идет по левой координате 144.0

df = tabula.read_pdf ("C: \ pdf1 .pdf ", guess = 'False', stream = 'True', encoding = 'utf-8', area = (100, 144, 500, 500)

можно ли найти текст из укажите c левую координату .. оставив остальные координаты динамически c?

...