Синтаксический анализ таблицы pdf возвращает текст с помощью (cid: xxx) - PullRequest
0 голосов
/ 02 января 2019

Камелот может правильно определить схему таблицы на странице PDF, однако некоторые столбцы содержат текст с cid как "(cid: 1005) (cid: 856) (cid: 1008) (cid: 1009) (cid: 1081) ".Кто-нибудь нашел решение, чтобы обойти эту проблему?

Я искал переполнение стека, но не смог найти решение для решения проблемы разрешения cids в простой текст.

...