Я ищу скрипт для извлечения текста таблицы из pdf с помощью pdfminer. Я пробовал Tabula, но я хочу интегрировать обычный текст и текст таблицы в базу данных. Любые идеи о том, как это реализовать, приветствуются.
может быть, вы можете получить представление по этим ссылкам
https://towardsdatascience.com/pdf-preprocessing-with-python-19829752af9f
https://gist.github.com/jmcarp/7105045