Необходимо понимать, что PDF на самом деле не реализован в виде одного документа.
Если ваши документы PDF создаются путем рендеринга текста в файл PDF, то прямое преобразование PDF не только возможно, но и можетбыть очень хорошим (надежным).
Если источником вашего PDF является сканер или факс (по сути, сканер ...), то у вас есть документ с «картинкой» текста.С этим сценарием сложнее разобраться.Если вы откроете для этого разметку, «текст» не будет преобразован.В этой ситуации вам приходится иметь дело с каким-либо способом оптического распознавания символов (OCR), который менее надежен из-за множества проблем.
Если у вас есть возможность перехватывать данные перед их передачей в PDF (скажем, как в SSRS или Crystal), тогда вам лучше обойти этап PDF и переместить ваши данные в документ Word.
Если вы ограничены в получении факсов и необходимости интерпретировать их содержимое, подготовьтедля OCR, черт возьми.Прошло много времени с тех пор, как я был там, поэтому я надеюсь, что он стал лучше.
Даже если на вашей машине установлен наш офис, у вас есть доступ (с помощью Visual Studios) к инструментарию разработчика Office, который позволитвы создаете документы для распространения в форматах Word. (. doc / .docx).