Lucene получил с пунктуацией - PullRequest
3 голосов
/ 30 июля 2010

При создании некоторых модульных тестов для моих запросов Lucene я заметил странное поведение, связанное с пунктуацией, особенно в круглых скобках.

Каковы некоторые из лучших способов справиться с полями поиска, которые содержат значительное количество знаков препинания?

Ответы [ 2 ]

3 голосов
/ 04 августа 2010

Если вы не настроили анализатор запросов, Lucene должен вести себя в соответствии с синтаксисом синтаксического анализатора запросов по умолчанию .Вы получаете что-то другое, чем это?Вы хотите, чтобы пунктуация имела особое значение или просто исключала пунктуацию из поисков?Другим обычным подозрением здесь является Analyzer , который определяет, как индексируется ваше поле и как запрос разбивается на части для поиска.Можете ли вы опубликовать конкретные примеры плохого поведения?

1 голос
/ 30 июля 2010

Это не просто круглые скобки, другие знаки препинания, такие как двоеточие, дефис и т. Д. Будут вызывать проблемы. Здесь - способ борьбы с ними.

...