Я пытаюсь извлечь таблицы из PDF-файлов с помощью этой python библиотеки Camelot. Однако, вот проблема, когда я пытаюсь использовать это. Таблицы в pdf файлах обычно появляются с заголовками. И после моего извлечения эти названия становятся частью этих таблиц. Как в этом примере:
import camelot
tables = camelot.read_pdf("p993.pdf",pages='7',flavor='stream')
tables.export('tables.csv', f='csv')
Таблица в файле PDF
И результат извлечения:
Результат
Что я могу сделать, чтобы извлечь таблицы без их заголовков?
Извините, у меня пока нет достаточной "репутации", поэтому я должен разместить изображения таким образом. (Требуется 10 репутаций, чтобы помещайте изображения в вопросы вместо ссылок на них.) На самом деле это мой самый первый вопрос! Я так новичок в этом ... Спасибо.