Я думаю о добавлении семантического анализа в мою установку Solr, но я точно не знаю, с чего начать.
По сути, я бы хотел, чтобы Solr мог найти "похожие" слова (взятые из основной части проиндексированных документов).
Например, если я ищу «музыку», я должен иметь возможность запросить семантический движок и получить «рок», «поп» и т. Д. (Конечно, если эти слова появились рядом с музыкой в некоторых из проиндексированных документов).
Я нашел этот проект, но я не знаю, является ли это правильным местом для начала:
http://code.google.com/p/semanticvectors/