Какой лучший скрипт PHP для индексирования документов, выполнения полнотекстового поиска и реализации версий? - PullRequest
1 голос
/ 13 марта 2012

Мне нужно проиндексировать длинный список документов (в основном это форматы MS Office, PDF) и выполнить полнотекстовый поиск и поддержку версий.

Я читал о lucene, но похоже, что это полное решение, кто-нибудь знает коммерческий полный индексатор?

Ответы [ 2 ]

1 голос
/ 13 марта 2012

Для управления версиями используйте git или mercurial .

Для «полнотекстового поиска» я нашел несколько ссылок:

http://zez.org/article/view/83/

http://www.phpriot.com/articles/zend-search-lucene

0 голосов
/ 20 марта 2012

Вы можете попробовать Recognition Server, программное обеспечение для массового распознавания текста, конвертации документов и индексирования. http://www.abbyy.com/recognition_server/

Это программное обеспечение создает цифровые архивы с возможностью поиска. Вы можете скачать пробную версию и попробовать ее бесплатно

...