Композитные слова в Lucene - PullRequest
0 голосов
/ 24 декабря 2011

возможно ли дать список составных слов в lucene для индексации текста?

например, я хочу индексировать "информацию о компьютере" как одно слово.

я могу это сделатьс преобразованием "Информация о компьютере" в "Computer_Information" или "ComputerInformation", но это преобразование очень сложно, проблема открыта здесь:

Заменить длинный список слов в большом текстовом файле

1 Ответ

1 голос
/ 26 декабря 2011

I написал для этого токен-фильтр , который вы можете использовать. Это то, что @jpountz описывал.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...