Я пытался использовать много библиотек для извлечения таблиц из PDF, таких как: camelot, tabula, PDFPlumber, PDFTabExtract ... но они не дают хорошего результата.Основная проблема в том, что заголовки находятся в сложном формате, а у меня другой формат заголовков.
с камелотом. У меня не может быть сценария, который работает для всех страниц моего PDF.с Табулой я получил запутанный информационный фрейм, когда таблица имеет повернутый текстовый заголовок.с PDFPlumber у меня возникла проблема с таблицей потоков (она хорошо работает только для таблицы решетки), а с PDFTabExtract у меня возникла проблема, когда текст поворачивается, он игнорируется.
есть ли решение, в которое я могу преобразовать любоетаблица в моем PDF, который имеет другой формат?я знаю, что не могу найти универсальное решение, но, по крайней мере, что-то, что дает достойный результат.
Должен ли я работать с OCR?чтобы вы посоветовали ?
Я действительно ценю любой результат.заранее спасибо.