tabula-py проблема чтения таблицы - PullRequest
0 голосов
/ 08 мая 2020

sample pdf table

Я пытаюсь прочитать этот PDF-файл, используя tabula-py со всеми параметрами по умолчанию. Что создает проблему. первая строка второй, третьей и четвертой таблиц отсутствует, когда я это делаю. Чтобы решить эту проблему, я начал использовать stream=True, что создает другую проблему. слова Location, Total и Elephant Road читаются как один текстовый блок. Итак, я попытался прочитать это как lattice=True, что снова пропускает 2, 3 и 4 таблицы. Есть какие-нибудь предложения или направления для меня?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...