Как извлечь текст таблицы из PDF-файлов с помощью pdfminer python - PullRequest
0 голосов
/ 07 февраля 2020

Я ищу скрипт для извлечения текста таблицы из pdf с помощью pdfminer. Я пробовал Tabula, но я хочу интегрировать обычный текст и текст таблицы в базу данных. Любые идеи о том, как это реализовать, приветствуются.

1 Ответ

0 голосов
/ 07 февраля 2020

может быть, вы можете получить представление по этим ссылкам

  1. https://towardsdatascience.com/pdf-preprocessing-with-python-19829752af9f

  2. https://gist.github.com/jmcarp/7105045

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...