Стандартный анализатор Lucene разделен на период - PullRequest
7 голосов
/ 14 марта 2011

Как сделать так, чтобы стандартный анализатор Lucene использовал токен '.' обугливается? Например, при запросе «B» мне нужно вернуть B в «A.B.C» как результат. Мне нужно относиться к числам так, как это делает стандартный анализатор, и, следовательно, простого анализатора недостаточно. Было бы идеально, если бы я мог просто указать стандартному анализатору токенизацию на «.» символ тоже Если бы мне пришлось написать свой собственный токенизатор только с этим небольшим расширением, как бы я поступил? Спасибо, Нача

1 Ответ

1 голос
/ 14 марта 2011

Я считаю, что проще всего создать свой собственный анализатор.который получит токены из StandardAnalyzer в качестве входных данных и далее разделит токены по точкам, сохраняя маркеры без точек без изменений.

Краткое описание пакета дает несколько советов, как это сделать. Это сообщение в блоге кажется очень актуальным, но использует старую версию Lucene, поэтому вам, вероятно, придется ее настроить.Также см. FAQ по Lucene .

...