Как min_doc_freq работает в More Like This Query - PullRequest
0 голосов
/ 18 апреля 2020

У меня есть некоторые части документов со следующей структурой:

"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Dupieux" } ]

И мой More Like This запрос выглядит следующим образом:

"_source": [ "directors.name" ],
"query": {
  "more_like_this": {
    "fields": [ "directors.name" ],
    "like": "quentin tarantino",
    "min_term_freq": 1,
    "min_doc_freq": 9
  }
}

I usnderstand, если я использую "min_doc_freq": 7, то в этом примере запрос должен получить только один документ "directors": [ { "name": "Quentin Dupieux" } ] Это правильно?

Но запрос получает только 3 документа:

"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Tarantino" } ]
"directors": [ { "name": "Quentin Dupieux" } ]

Я не понимаю, почему .. Кто-нибудь может сказать мне, почему запрос получает только 3 "документа"

Спасибо!

1 Ответ

0 голосов
/ 20 апреля 2020

Я нашел решение моей ошибки, мне нужно было установить количество шардов в 1 для эластичного поиска 7.6.2 и для эластичного поиска 7.4.2 я установил количество шардов и количество реплик в 1 при создании индекса. Значения по умолчанию

"number_of_shards": 1

"number_of_replicas": 1

Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...