Сортировка в Lucene трактует слово по-разному в верхнем и нижнем регистре? - PullRequest
0 голосов
/ 09 июня 2011

У меня есть следующий код для сортировки [1], но в итоге я получил результирующий набор, в котором слова начинаются с цифры, помещенной вначале, а затем слова в верхнем регистре сортируются по возрастанию, а слова в нижнем регистре сортируются по возрастанию внизу, как показано ниже [2].

Это задумано?Если да, то как я могу их отсортировать без учета случая?

[1] Searcher.Search(Query, null, 30, new Sort(new SortField("title", SortField.STRING)));

[2] [42bskfdj3434] [Быстрая пятерка] [Зеленый фонарь] [Кунг-фуПанда] [Боб] [ноутбук] [xoom] [yearn]

1 Ответ

1 голос
/ 09 июня 2011

Индексируйте поле «title» как АНАЛИЗОВАННОЕ и используйте анализатор, который вводит нижний регистр входного текста (например, StandardAnalyzer)

...