Преобразование PDF-файла с изображением в формат PDF с поддержкой оптического распознавания текста - PullRequest
2 голосов
/ 15 декабря 2011

Я не уверен, что мой заголовок чрезмерно описывает то, что я пытаюсь сделать, поэтому я попробую и elabarate.

Меня попросили разработать небольшое приложение, где кто-то может загрузить PDF на сайт. Сайт написан на ASP classic, но я не против пойти по пути .net.

После загрузки кода необходимо проверить, является ли PDF текстовым, если нет, то необходимо преобразовать документ в текстовый тип PDF.

Кто-нибудь имеет представление о компоненте, который может сделать это преобразование PDF изображения в текст PDF? До сих пор я изучал:

Я не слишком понимал, что делает призрак, и похоже, что решение websupergoo конвертирует изображения в текстовые файлы?

Ответы [ 2 ]

2 голосов
/ 19 декабря 2011

Я думаю, что вы можете использовать один из нескольких веб-сайтов, которые позволяют загружать изображения и отправлять вам данные OCR. Попробуйте www.ocrsdk.com , это облачный OCR SDK, недавно выпущенный ABBYY. В настоящее время он находится в закрытой бета-версии, поэтому он полностью бесплатен.

1 голос
/ 15 декабря 2011

Если вы можете позволить себе коммерческий вариант, вы можете использовать Amyuni PDF Creator .Net с asp.net или Amyuni PDF Creator ActiveX , если вы хотите остаться на asp-classic , Посмотрите на модуль OCR для обработки PDF-изображений в PDF-текст.

Применяется обычный отказ от ответственности

...