люцен 3.0.3 |проблема поиска с файлом * .docx - PullRequest
0 голосов
/ 12 апреля 2011

Я создаю индекс с помощью StandardAnalyzer для *. Docx файла, все хорошо. Но во время поиска он не дает результата для этих * .docx файлов.

любая помощь или предложение будет оценено !!!

1 Ответ

0 голосов
/ 12 апреля 2011

Как преобразовать файл * .docx в индексируемый (текстовый) формат?

Мы используем Apache POI для индексирования нашего * .docx (и других офисных форматов), и это прекрасно работает!

Вы можете посмотреть на реализацию здесь: http://code.google.com/p/gtxcontentconnector/source/browse/#svn%2Ftrunk%2Fcontentconnector-poi-transformer%2Fsrc%2Fmain%2Fjava%2Fcom%2Fgentics%2Fcr%2Flucene%2Findexer%2Ftransformer

...