Solr и Unicode - PullRequest
       30

Solr и Unicode

0 голосов
/ 03 февраля 2012

Я установил и настроил Solr, Tika и попробовал индексировать и искать документы. До сих пор все работало нормально. Но есть проблема с Unicode (конечно :)). Я проиндексировал документ с текстом Unicode о футбольном клубе Red Star (Црвена звезда). Когда я пытаюсь найти эту статью и набрать "Црвена" или "звезда", Solr находит правильный документ.

Как мне создать список синонимов для этих слов (или других слов кириллицы)? Что мне нужно сделать, чтобы Solr смог найти документы, даже если я наберу "звезде", "звезду" и т. Д.?

Лучший, Joksimovic

1 Ответ

0 голосов
/ 03 февраля 2012

Solr предоставляет интерфейс для синонимов , а также SpellCheckComponent .

Однако ваша проблема на самом деле не связана с проблемой Unicode.

...