![sample pdf table](https://i.stack.imgur.com/cPhJt.png)
Я пытаюсь прочитать этот PDF-файл, используя tabula-py
со всеми параметрами по умолчанию. Что создает проблему. первая строка второй, третьей и четвертой таблиц отсутствует, когда я это делаю. Чтобы решить эту проблему, я начал использовать stream=True
, что создает другую проблему. слова Location
, Total
и Elephant Road
читаются как один текстовый блок. Итак, я попытался прочитать это как lattice=True
, что снова пропускает 2, 3 и 4 таблицы. Есть какие-нибудь предложения или направления для меня?