Я хочу конвертировать PDF в HTML с помощью C # ... Может кто-нибудь, пожалуйста, дайте какие-либо идеи ..
Да, см. Здесь пример преобразования PDF с использованием C #: https://github.com/pdftables/csharp-pdftables-api
Вам необходимо изменить:
const string format = "xlsx-single";
на
const string format = "xml";
или
const string format = "html";
Редактировать (оригинал содержал ссылку на html в pdf, а не наоборот):
С Google я получил вам , что близко (генерирует текст).Это должно дать вам отправную точку.В этой теме на asp.net объясняется, как вы можете получить HTML, используя эту технику (перейдите к примеру кода).
И, на SO, найдите этот pdf-to-html tag , и вы найдете это сообщение .Проверьте ссылку для iTextSharp , которая предоставит вам интерфейс для документа PDF.