Tabula Py не обнаруживает таблицы в PDF - PullRequest
0 голосов
/ 06 января 2019

Я использовал следующий код, но ничего не обнаружено. Я также пробовал разные PDF-форматы, но получил тот же результат.

from tabula import read_pdf,convert_into

df=read_pdf("1415_048.pdf",output_format="dataframe",encoding='utf-8',java_options=None,multiple_tables=True)

Где PDF выглядит так enter image description here

[] #This is the result I'm getting 

1 Ответ

0 голосов
/ 06 февраля 2019

tabula-py основан на tabula-java. И это работает только с текстовым PDF.

По данным сайта tabula.app https://tabula.technology/:

Примечание. Tabula работает только с текстовыми PDF-файлами, а не с отсканированными документами.

...