Как я могу конвертировать PDF в документ без microsoft.office.interop? - PullRequest
0 голосов
/ 22 апреля 2011

Мне нужно конвертировать файлы PDF в файлы .doc, используя C #.На компьютере нет файловой системы, хотя на нем не установлен Office.Любые хорошие идеи, как я могу подойти к этому?Я провел некоторое исследование, и большинство людей пользуются услугами взаимодействия.

Ответы [ 3 ]

0 голосов
/ 22 апреля 2011

Необходимо понимать, что PDF на самом деле не реализован в виде одного документа.

Если ваши документы PDF создаются путем рендеринга текста в файл PDF, то прямое преобразование PDF не только возможно, но и можетбыть очень хорошим (надежным).

Если источником вашего PDF является сканер или факс (по сути, сканер ...), то у вас есть документ с «картинкой» текста.С этим сценарием сложнее разобраться.Если вы откроете для этого разметку, «текст» не будет преобразован.В этой ситуации вам приходится иметь дело с каким-либо способом оптического распознавания символов (OCR), который менее надежен из-за множества проблем.

Если у вас есть возможность перехватывать данные перед их передачей в PDF (скажем, как в SSRS или Crystal), тогда вам лучше обойти этап PDF и переместить ваши данные в документ Word.

Если вы ограничены в получении факсов и необходимости интерпретировать их содержимое, подготовьтедля OCR, черт возьми.Прошло много времени с тех пор, как я был там, поэтому я надеюсь, что он стал лучше.

Даже если на вашей машине установлен наш офис, у вас есть доступ (с помощью Visual Studios) к инструментарию разработчика Office, который позволитвы создаете документы для распространения в форматах Word. (. doc / .docx).

0 голосов
/ 28 апреля 2011

используйте aspose pdf kit, чтобы преобразовать pdf в текст, а затем перевести текст в doc, используя файловый поток или aspose doc

0 голосов
/ 22 апреля 2011

Опцией / идеей может быть преобразование PDF в HTML, который можно открыть в Word?

...