Я хотел бы извлечь текст, включая таблицы из файла PDF.
Я пытался camelot
.Он не может получить только данные таблицы, но не текст.
Я также пробовал PDF2.Он не может читать китайские иероглифы.
Вот пример pdf для чтения.
Что мне следует попробовать дальше?
Спасибо.