Question

Мои рабочие требования я использую pymupdf для извлечения таблиц из файлов PDF и экспорта в формат CSV.

BoarGules · Answer 1 · 15 мая 2019

Боюсь, вам не повезло.Формат PDF не имеет внутреннего представления структуры таблицы, что затрудняет извлечение таблиц для анализа.Вы должны сделать вывод о существовании таблицы, увидев, где расположены столбцы данных.

Есть модули, которые сделают это за вас: один - Excalibur .Но pymupdf - это извлечение текста из текста, и вам придется заниматься анализом и выводом самостоятельно.Это довольно амбициозный проект.

Как извлечь таблицу из PDF-файла с помощью pymupdf

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как извлечь таблицу из PDF-файла с помощью pymupdf

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов