У меня работает StandardAnalyzer, который извлекает слова и частоты из одного документа, используя TermVectorMapper, заполняющий HashMap.
Но если я использую следующий текст в качестве поля в моем документе, то есть
addDoc(w, "lucene Lawton-Browne Lucene");
Частоты слова, возвращаемые в HashMap:
Browne 1
Люцен 2
Лоутон 1
Проблема в том, что слова "Lawton" и "Browne". Если это фактическое «двуствольное» имя, может ли Lucene распознать его как «Lawton-Browne», где имя фактически является одним словом?
Я пробовал комбинации:
addDoc(w, "lucene \”Lawton-Browne\” Lucene");
И одинарные кавычки, но без успеха.
Спасибо
Мистер Морган.