Как определить, почему в ответе SOLR возвращаются определенные документы, которые могут не иметь отношения к данному поиску по ключевым словам? - PullRequest
1 голос
/ 12 апреля 2019

Мы видим определенные документы в ответе WCS SOLR, которые не релевантны для данного ключевого слова поиска, но являются частью текущего каталога / категорий клиентов / сайтов. Я вижу информацию об отладке SOLR, запросы синтаксического анализатора, фильтры и т. Д., Но пытаюсь узнать, возможно ли узнать, почему документ был включен в ответ. Я вижу строку объяснения и не потратил время на понимание всего алгоритма, стоящего за ней, хотел бы узнать, есть ли быстрый способ узнать, почему документ попал в список результатов / ответов. Это может помочь выявить проблему структуры данных каталога / категорий или любые ошибки в нашей реализации SOLR.

Можно ли увидеть отладочную информацию на каждом уровне возвращаемого документа в ответе, если это помогает понять, как сконфигурирована и работает SOLR в среде?

Спасибо

1 Ответ

2 голосов
/ 12 апреля 2019

Когда вы передаете debugQuery=true в запросе, вы можете увидеть в узле debug/explain ответа причину оценки каждого документа. Информация будет выглядеть примерно так:

...
"debug": {
  ...
  "explain": {
    "id:1": "info about the score for document 1",
    "id:2": "info about the score for document 2",
    "id:3": "info about the score for document 2",
    "id:4": "info about the score for document 4",
    ...
  }
}

Информация не совсем легко разобрать и расшифровать, но это может быть хорошим началом.

Я объясняю в этом посте больше о том, как читать информацию в разделе explain: https://library.brown.edu/DigitalTechnologies/understanding-scoring-of-documents-in-solr/

...