Я использую Solr 7.6 со следующей структурой документа:
{
"source_ln":"en",
"source_text":"the sky is blue",
"target_ln":"hi",
"target_text":"आसमान नीला है",
},
{
"source_ln":"en",
"source_text":"the sky is also called the celestial sphere",
"target_ln":"hi",
"target_text":"आकाश को आकाशीय क्षेत्र भी कहा जाता है",
}
Все поля определены с помощью токенайзера StandardTokenizerFactory.
Когда я запрашиваю "source_text": "the sky ",
Набор результатов должен содержать только первый документ.
Во втором документе поле" source_text ":" небо также называется небесной сферой "содержит 8 терминов, а поле запроса "source_text": "небо" содержит только 2 условия, поэтому не менее 50% критериев соответствия не выполнены, и, следовательно, 2-й документ не будет в наборе результатов.
Есть ли способ получить документы, соответствующие не менее 50% терминов / токенов поля запроса?
Заранее спасибо.