PDF в HTML или аналогичный - PullRequest
2 голосов
/ 06 июня 2011

Я создаю приложение для просмотра PDF-файлов через браузер без использования плагина на мобильных устройствах.Я попробовал ImageMagick и ghostscript, чтобы преобразовать страницы в изображения, но они слишком велики, и текст становится неясным.Я вижу веб-сайт, предлагающий услугу преобразования pdf в html и выполняющую работу по спуску, но я не могу найти пример того, как это достигается.Буду признателен за любую оказанную помощь.Спасибо!

Ответы [ 3 ]

1 голос
/ 30 июля 2012

Если вы хотите конвертировать PDF в HTML и планируете запустить конвертацию на сервере, тогда вы можете попробовать pdf2html. Это программа, упакованная как часть утилиты poppler. Я не знаю, как программа выполняет это.

1 голос
/ 08 августа 2012

Я гуглил и наткнулся на ссылку ниже, объясняющую, как scridb.com реализует преобразование.http://coding.scribd.com/2010/06/01/the-perils-of-stacking/

1 голос
/ 06 июня 2011

РЕДАКТИРОВАТЬ: Я, кажется, прочитал вопрос в обратном направлении. В этом случае лучше всего проанализировать PDF-файл, а затем отформатировать HTML-код в зависимости от того, что вы найдете. Я полагаю, что опция javapdf способна на это, но я не использовал ни одного из них, поэтому я не уверен. Если хуже становится хуже, и вы не можете найти программное обеспечение для дизассемблирования PDF, вы можете написать свой собственный дизассемблер на Java или PHP, прочитав спецификацию PDF. Желаем удачи!

http://www.adobe.com/devnet/pdf/pdf_reference.html - спецификация PDF (модифицированная версия Adobe, поскольку они наиболее популярны, возможно, вы захотите поддерживать их расширения)

- СТАРЫЙ - Эти веб-сайты, вероятно, пишут свое собственное программное обеспечение для решения этой задачи. Если вы действительно заинтересованы в этом начинании, я бы предложил проанализировать HTML-код, чтобы получить данные и информацию о стиле, и использовать его для форматирования каких-либо API-интерфейсов для записи PDF. Быстрый поиск в Google дает следующее: - END OLD -

http://www.cutepdf.com/Solutions/

http://ruby -pdf.rubyforge.org / PDF-автор / документ / index.html

http://asprise.com/product/javapdf/

...