Поиск в Интернете с использованием PDF - PullRequest
0 голосов
/ 04 февраля 2010

В своем информационном бюллетене я хочу вставить поисковую форму для поиска среди моих HTML-документов на моем сайте. Как я могу добавить такую ​​форму? PS: я не хочу, чтобы "поиск в Google PDF документов", я хочу, чтобы мой PDF поиска в Интернете! спасибо

Ответы [ 2 ]

0 голосов
/ 04 февраля 2010

Насколько я понял, у вас есть рассылка, отправленная клиентам, где вы хотите ввести данные для формы поиска, которая найдет документы PDF на вашем сайте.

Первая часть проста - форма, которая приведет на ваш сайт. Как

<form action='http://yoursite.com/some_pdf_search_action/'>
<input type='text' name='q' />
<input type='submit' />
</form>

Вторая часть требует предварительного индексирования PDF. Doint это на сервере довольно сложно. Прочитайте решение pdflib для php по адресу http://php.net/manual/bg/ref.pdf.php (поиск "pdf2text"). Потребуются дополнительные пакеты для установки.

После этого необходимо проиндексировать pdf в виде текста, сохранить его в базе данных и выполнить поиск с использованием естественного синтаксиса LIKE или логического значения. Или если у вас слишком много документов - используйте lucene или sphinx

0 голосов
/ 04 февраля 2010

Я думаю, что механизм называется «Acroforms» (хотя, возможно, они и изменили название)

В этом документе приведены некоторые сведения об API:

http://www.google.com/url?sa=t&source=web&ct=res&cd=1&ved=0CAkQFjAA&url=http%3A%2F%2Fpartners.adobe.com%2Fpublic%2Fdeveloper%2Fen%2Facrobat%2Fsdk%2FFormsAPIReference.pdf&rct=j&q=Acroforms+&ei=RPFqS4fEHYfk8Qalpon8BQ&usg=AFQjCNH_DDuR6xxm8KJ0a6ZG4S-8XRa0VA

Не уверен, что вам нужен «Дистиллятор» или что-то подобное, чтобы создать их ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...