Мне нужно проиндексировать длинный список документов (в основном это форматы MS Office, PDF) и выполнить полнотекстовый поиск и поддержку версий.
Я читал о lucene, но похоже, что это полное решение, кто-нибудь знает коммерческий полный индексатор?
Для управления версиями используйте git или mercurial .
Для «полнотекстового поиска» я нашел несколько ссылок:
http://zez.org/article/view/83/
http://www.phpriot.com/articles/zend-search-lucene
Вы можете попробовать Recognition Server, программное обеспечение для массового распознавания текста, конвертации документов и индексирования. http://www.abbyy.com/recognition_server/
Это программное обеспечение создает цифровые архивы с возможностью поиска. Вы можете скачать пробную версию и попробовать ее бесплатно