Боюсь, вам не повезло.Формат PDF не имеет внутреннего представления структуры таблицы, что затрудняет извлечение таблиц для анализа.Вы должны сделать вывод о существовании таблицы, увидев, где расположены столбцы данных.
Есть модули, которые сделают это за вас: один - Excalibur .Но pymupdf
- это извлечение текста из текста, и вам придется заниматься анализом и выводом самостоятельно.Это довольно амбициозный проект.