Как извлечь таблицы из PDF-файлов, используя camelot-py, не извлекая заголовки таблиц в результаты? - PullRequest
0 голосов
/ 01 марта 2020

Я пытаюсь извлечь таблицы из PDF-файлов с помощью этой python библиотеки Camelot. Однако, вот проблема, когда я пытаюсь использовать это. Таблицы в pdf файлах обычно появляются с заголовками. И после моего извлечения эти названия становятся частью этих таблиц. Как в этом примере:

import camelot
tables = camelot.read_pdf("p993.pdf",pages='7',flavor='stream')
tables.export('tables.csv', f='csv')

Таблица в файле PDF

И результат извлечения:

Результат

Что я могу сделать, чтобы извлечь таблицы без их заголовков?

Извините, у меня пока нет достаточной "репутации", поэтому я должен разместить изображения таким образом. (Требуется 10 репутаций, чтобы помещайте изображения в вопросы вместо ссылок на них.) На самом деле это мой самый первый вопрос! Я так новичок в этом ... Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...