Question

Я пытаюсь извлечь таблицы из PDF-файлов с помощью этой python библиотеки Camelot. Однако, вот проблема, когда я пытаюсь использовать это. Таблицы в pdf файлах обычно появляются с заголовками. И после моего извлечения эти названия становятся частью этих таблиц. Как в этом примере:

import camelot
tables = camelot.read_pdf("p993.pdf",pages='7',flavor='stream')
tables.export('tables.csv', f='csv')

Таблица в файле PDF

И результат извлечения:

Результат

Что я могу сделать, чтобы извлечь таблицы без их заголовков?

Извините, у меня пока нет достаточной "репутации", поэтому я должен разместить изображения таким образом. (Требуется 10 репутаций, чтобы помещайте изображения в вопросы вместо ссылок на них.) На самом деле это мой самый первый вопрос! Я так новичок в этом ... Спасибо.

Как извлечь таблицы из PDF-файлов, используя camelot-py, не извлекая заголовки таблиц в результаты?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как извлечь таблицы из PDF-файлов, используя camelot-py, не извлекая заголовки таблиц в результаты?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов