Индексирование файлов и поиск их через веб-приложение - PullRequest
1 голос
/ 25 июля 2011

У меня есть общая папка в локальной сети, которая содержит много документов PDF и DOC.Я хочу создать веб-страницу в php / Asp, чтобы можно было как-то индексировать эти PDF-файлы и документы и искать содержимое в них.

Результаты поиска покажут мне соответствующие результаты.Как я могу это сделать ?Какая процедура?Можно ли это сделать?

Ответы [ 3 ]

2 голосов
/ 26 июля 2011

Все версии Windows-серверов включают в себя простую в использовании службу индексирования, к которой вы можете получить программный доступ без установки какого-либо стороннего программного обеспечения. Это может проиндексировать практически любой вид документа, который вы можете себе представить, либо через сторонние iFilters .

Если вы используете сервер 2003 или ниже, он, вероятно, уже установлен на вашем сервере, введите управление компьютером, и он будет указан в разделе «Службы и приложения». Если вы используете 2008, добавьте его в роль файловых служб в разделе «Файловые службы Windows Server 2003».

После установки следуйте этому руководству, чтобы создать новый индекс .

Он должен индексировать документы Office из коробки, если нет, вы не можете бесплатно загрузить полный пакет Office iFilter . Для индексирования PDF-файлов вам нужно всего лишь установить Adobe Reader на сервер, и iFilter будет установлен рядом с ним.

Теперь вы можете разрабатывать свои собственные страницы поиска в ASP для запроса индекса. Он чрезвычайно мощный и очень быстрый, плюс он подчиняется разрешениям NTFS, поэтому вы можете безопасно индексировать все свои файлы, зная, что (если вы используете проверку подлинности Windows - IIS), что пользователь, выполняющий поиск, будет видеть только те файлы, к которым он имеет доступ.

Мы используем сервер индексирования во всех наших офисах с огромным успехом, Я посмотрю, разрешено ли мне открывать исходные тексты нашего решения , но весь код там в любом случае .

Вы можете использовать наше решение в качестве базы и предоставить вам полный доступ к вашим файлам.

1 голос
/ 25 июля 2011

Вы можете выбрать одно из нескольких решений, все они в основном требуют, чтобы вы внедрили систему, в которой есть:

1) Поисковая система

2) Клиент (веб)

Возможно, более подходящим решением является использование Solr в качестве движка и PHP в качестве клиента.Вы можете найти учебник по кик-старту здесь:

http://www.ibm.com/developerworks/opensource/library/os-php-apachesolr/

0 голосов
/ 08 ноября 2013

Вы можете создать дерево динамически (любой алгоритм рекурсивного дерева), которое будет отражать фактическую структуру документа, и вы можете отобразить дерево на веб-странице.

Чтобы показать дерево на веб-странице, вы можете использовать древовидную структуру jquery / yui из PHP.

В нижней части дерева у вас есть файлы.Когда пользователь нажимает его, вы можете показать содержимое файла в браузере.

Если ваша структура папок имеет слишком много уровней, возможно, вы можете использовать некоторый кеш, чтобы вам не нужно было создавать динамическое дерево при необходимости.всего наилучшего.

...