Я хотел бы знать, есть ли какой-нибудь способ индексировать файлы .doc, .pdf, .xls, .ppt, mp3 и т. Д., Используя lucene zend framework.
Большое спасибо и всего наилучшего
Готовое решение (хорошо для быстрого выполнения действий) см. lucene-silverstripe-plugin.
Для грубого подхода (хорошо, если вам нравится изучать внутреннее устройство),
Для получения PDF см. http://www.kapustabrothers.com/2008/01/20/indexing-pdf-documents-with-zend_search_lucene/#.TxbJ5jzhdtM
. В аналогичных строках вы также можете индексировать другие файлы.Ms-слово (файл .doc) см.
Чтение / запись файла MS Word на PHP
http://davidwalsh.name/read-pdf-doc-file-php