Я построил обнаруженную границу таблицы на странице 3, используя $ camelot -p 3 lattice -plot contour 007.pdf
. Похоже, что Camelot не включает строку заголовка в обнаруженной границе таблицы [ошибка 1] (см. Изображение ниже). Затем я попытался использовать аргумент ключевого слова table_areas
с flavor='lattice'
, но затем он не включал строки в указанную границу таблицы [ошибка 2]. Я добавил их в систему отслеживания проблем как # 200 и # 201 .
Вы можете все еще использовать ключевое слово table_areas
с flavor='stream'
, чтобы получить таблицу.
Использование CLI: $ camelot -p 3 --output 007.csv --format csv stream -T 60,770,520,400 007.pdf
Использование API: tables = camelot.read_pdf('007.pdf', pages='3', flavor='stream', table_areas=['60,770,520,400'])
Вы можете найти координаты границы таблицы, используя шаги, описанные здесь: https://camelot -py.readthedocs.io / en / master / user / advanced.html # visual-debugging
Надеюсь, это поможет!