Существуют ли какие-либо классы, COM-объекты, утилиты командной строки или что-либо еще, для чего я могу создать API, для которого можно конвертировать PDF в документ HTML? Очевидно, что преобразование может быть немного грубым, поскольку PDF-файлы могут содержать намного больше, чем может описать HTML. Я нашел утилиту под названием pdftohtml в Source Forge, но, честно говоря, она делает ужасную работу с конвертацией. Меня не волнует, является ли программное обеспечение бесплатным или коммерческим, но есть ли вообще что-нибудь, что я могу включить в свое собственное программное обеспечение, чтобы сделать такого рода преобразование хотя бы прилично? Я знаю, что Google разработал свой собственный метод для этого, поскольку вы можете нажать «Просмотр в формате HTML» на PDF-документе, прикрепленном к электронному письму через Gmail, но я надеялся, что что-то будет доступно для широкой публики.
Помните, PDF в HTML. Я НЕ беспокоюсь о HTML в PDF.