У меня есть файлы PDF, которые были «распознаны» с помощью функции распознавания текста OCR -> Распознать текст с помощью функции OCR в Acrobat.
Я хотел бы принять их в качестве загрузки (C # ASP.NET MVC) и иметь возможность извлекать эту информацию для целей индексации и поиска.
Я попытался открыть PDF-файлы и не нашел ни одного распознанного текста, поэтому предположил, что он сжати / или закодированы.
Есть идеи?