Технология для чтения PDF-файлов онлайн с аннотациями? - PullRequest
1 голос
/ 17 мая 2009

Есть ли решение с открытым исходным кодом, которое отображает PDF-файлы для онлайн-чтения? Он должен быть доступен для поиска так же, как книги в Google и, если возможно, имеет возможность отображать аннотации?

Ответы [ 7 ]

6 голосов
/ 23 мая 2009

Под "онлайн-чтением" я предполагаю, что вы имеете в виду без плагина для чтения PDF на клиенте. В этом случае вам нужно конвертировать в HTML

http://pdftohtml.sourceforge.net/

Если вы не против потерять возможность копировать текст, то преобразование в PNG может дать вам более точную визуализацию

http://www.imagemagick.org/

Независимо от формата вывода вы можете управлять поиском, используя оригинальные данные PDF. Одной из технологий для этого является многопоисковый

http://www.mnogosearch.org/

Monogosearch использует pdftotext внутри, это может оказаться полезным, если вы хотите написать свои собственные процедуры поиска. pdftotext является частью пакета утилит Xpdf

http://www.foolabs.com/xpdf/about.html

Все перечисленные выше инструменты доступны в Windows или Linux

1 голос
/ 28 мая 2009

Вас также может заинтересовать платформа Vuzit DocuPub: http://vuzit.com/products/docupub_platform

Сама технология отображения не является открытым исходным кодом, но они предоставляют API для доступа к своему сервису, поэтому, возможно, ее стоит изучить.

0 голосов
/ 28 мая 2009

Это не с открытым исходным кодом, но проверить его в любом случае. Вы можете скачать бесплатную пробную версию их SDK, чтобы попробовать его. Читать PDF-файлы и их аннотации непросто, и я бы не стал доверять производственному приложению декодеры с открытым кодом.

Вот онлайн демо. http://www.atalasoft.com/ajaxannotations/default.aspx

Еще одна хорошая программа для чтения PDF - FoxitReader.

0 голосов
/ 27 мая 2009

PyPdf действительно хорош. Он поддерживает чтение текста, а также шифрование, которое я знаю, что itextsharp не делает.

Конечно, вам придется программировать на python, так как библиотеки классов IronPython не совсем подходят для того, чтобы вы могли от них отказаться и использовать их. (Но я думаю, что они скоро будут) PyPdf

0 голосов
/ 26 мая 2009

ICEPdf недавно выпустил свой код в качестве открытого источника. Он основан на Java.

0 голосов
/ 26 мая 2009

Не уверен, что они делают аннотации, но оба из них довольно хорошо покажут PDF-файлы:

http://pdfmenot.com

http://docs.google.com

0 голосов
/ 26 мая 2009

Не знаю, ищете ли вы программное обеспечение для установки или какую-то услугу для оплаты ... Я много читал о www.getbackboard.com (это не реклама, а только сообщение о том, что я прочитал, что, возможно, соответствует вашим потребностям ...;)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...