Я создаю индекс с помощью StandardAnalyzer для *. Docx файла, все хорошо. Но во время поиска он не дает результата для этих * .docx файлов.
любая помощь или предложение будет оценено !!!
Как преобразовать файл * .docx в индексируемый (текстовый) формат?
Мы используем Apache POI для индексирования нашего * .docx (и других офисных форматов), и это прекрасно работает!
Вы можете посмотреть на реализацию здесь: http://code.google.com/p/gtxcontentconnector/source/browse/#svn%2Ftrunk%2Fcontentconnector-poi-transformer%2Fsrc%2Fmain%2Fjava%2Fcom%2Fgentics%2Fcr%2Flucene%2Findexer%2Ftransformer