Конвертировать PDF в HTML / XML с помощью C # - PullRequest
1 голос
/ 03 августа 2010

Я хочу конвертировать PDF в HTML с помощью C # ... Может кто-нибудь, пожалуйста, дайте какие-либо идеи ..

Ответы [ 2 ]

0 голосов
/ 11 июля 2019

Да, см. Здесь пример преобразования PDF с использованием C #: https://github.com/pdftables/csharp-pdftables-api

Вам необходимо изменить:

const string format = "xlsx-single";

на

const string format = "xml";

или

const string format = "html";
0 голосов
/ 03 августа 2010

Редактировать (оригинал содержал ссылку на html в pdf, а не наоборот):

С Google я получил вам , что близко (генерирует текст).Это должно дать вам отправную точку.В этой теме на asp.net объясняется, как вы можете получить HTML, используя эту технику (перейдите к примеру кода).

И, на SO, найдите этот pdf-to-html tag , и вы найдете это сообщение .Проверьте ссылку для iTextSharp , которая предоставит вам интерфейс для документа PDF.

...