Сфинкс предложение как запрос - PullRequest
0 голосов
/ 18 ноября 2010


Моя задача - найти аналогичное предложение в коллекции баз данных.

Не могли бы вы порекомендовать, какой тип запроса использовать?

Пример: Поиск: Добро пожаловать в первый пример кода.

И, допустим, следующие предложения подходят для моего запроса:

База данных:

...

Добро пожаловать в первый фильм ...

Это первый пример кода ...

Добро пожаловать!...

Спасибо

1 Ответ

3 голосов
/ 22 ноября 2010

Если я правильно понял, каждое предложение в БД, которое включает одно или несколько слов из поискового запроса, подойдет.

В этом случае вы должны использовать режим SPH_MATCH_ANY или SPH_MATCH_EXTENDED2 с оператором | (ИЛИ).

Режимы согласования ...

Расширенный синтаксис запроса ...

Если вы хотите исключить такие слова, как «to», «the» и другие короткие слова, у вас есть несколько вариантов:

1) Если вы уверены, что каждое слово длиной менее 4 букв должно быть исключено, добавьте следующую строку в файл sphinx.conf:

min_word_len = 4

Подробнее ...

2) если вы хотите исключить определенные слова, используйте файл (ы) стоп-слов.

Добавьте следующие строки в sphinx.conf:

#path to txt file with words to be excluded (space separated)
stopwords = /usr/local/sphinx/configuration/stopwords.txt   

Подробнее ...

И последнее, что вы должны знать, это то, что я только что представил очень простые вещи, которые четко объяснены в документации, и мои примеры также взяты оттуда.

...