Конвертируйте PDF во все, что может быть открыто Word - PullRequest
2 голосов
/ 11 сентября 2010

Хотите сделать это через C #, все встроенные, без Process.Start () ... и бесплатные ... могут быть RTF, HTML, в любом случае ... если я могу открыть в Word, затем я могу сохранить его как RTF, который затем можно загрузить в RichTextBox.

Мне известно, что подобные вопросы наводнили этот форум на протяжении многих лет, но, похоже, нет ничего, что отвечало бы тому, что я спрашиваю.

EDIT:

Похоже, это можно сделать здесь: http://www.itextpdf.com/examples/iia.php?id=275

Ответы [ 2 ]

2 голосов
/ 11 сентября 2010

Используйте библиотеку PDF, например, iTextSharp для анализа PDF.Вы сможете получить доступ ко всему тексту и изображениям из PDF и преобразовать их в любое нужное вам представление.

Существуют и другие решения (например, установка xpdf и его обстрел - он преобразуетв html, если переданы правильные аргументы командной строки).

0 голосов
/ 11 сентября 2010

Я не уверен, что Word может открыть PDF, если вы не создали PDF в документе Word.

Я думаю, что единственное быстрое решение - это купить или найти стороннюю библиотеку, которая обрабатывает PDF, а затем использовать ее API для извлечения нужного вам текста. Я уверен, что текст в любом случае был бы крайне плохо отформатирован. Также имейте в виду, что некоторые PDF-файлы, которые показывают текст, на самом деле сохраняют его в виде изображения, поэтому не будет никакого способа вывести данные.

...