Доступ к тексту, распознаваемому Acrobat OCR - PullRequest
0 голосов
/ 25 июня 2010

У меня есть файлы PDF, которые были «распознаны» с помощью функции распознавания текста OCR -> Распознать текст с помощью функции OCR в Acrobat.

Я хотел бы принять их в качестве загрузки (C # ASP.NET MVC) и иметь возможность извлекать эту информацию для целей индексации и поиска.

Я попытался открыть PDF-файлы и не нашел ни одного распознанного текста, поэтому предположил, что он сжати / или закодированы.

Есть идеи?

1 Ответ

3 голосов
/ 25 июня 2010
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...