Включить синонимы в Solr - PullRequest
0 голосов
/ 28 июня 2011

Я использую Solr для моих поисков. в этом я нашел файл synonyms.text, в который вы можете вручную включить синонимы для слов, которые вы хотите.

Но, как я полагаю, было бы очень трудно включить синонимы вручную для каждого слова, поскольку мое приложение имеет большие данные.

Я хочу знать, есть ли способ, чтобы этот файл synonym.text генерировал автоматически, обращаясь ко всем словарным словам

1 Ответ

0 голосов
/ 28 июня 2011

Это имхо не возможно.Вам нужно как минимум семантическое отношение между двумя словами, то есть токенами.Если у вас есть что-то вроде базы данных, включающей семантические отношения синонимов, вы, конечно, можете сгенерировать эти данные.

Одним из примеров будет wiktonary (дамп XML: Link ).Но, возможно, есть и другие примеры словарей, но я думаю, что вы не получите такой исчерпывающий источник, как пожелаете.Разбор XML-дамп Wiktonary, возможно, ваш лучший выбор, и вы даже можете выровнять синонимы на разных языках, если у вас есть многоязычный индекс.

...