Я использую tika
в своем приложении Python для извлечения текста из документов.Все работает нормально, но оно не извлекается из изображения в файле PDF.Tika
извлекает текст из PDF, а также изображений, но не из PDF, содержащего изображения.Я немного смущен.Есть ли способ сделать это?Нужно ли конвертировать файл PDF в изображение?