Можно ли иметь точность 100% в системе поиска текста? - PullRequest
0 голосов
/ 21 декабря 2010

Поскольку формула точности равна:

retrieved_and_relevant / (retrieved_and_relevant + retrieved_and_irrelevant)

Мне интересно, будет ли когда-либо значение точности в системе поиска текста отличаться от 100%,Я так думаю, потому что все мы, программисты, прилагаем огромные усилия, чтобы не забыть сжать каждый текст всех документов.Таким образом, когда текст запроса запускается в систему поиска текста, он выводит все документы, содержащие текст запроса.Это означает, что все полученные документы являются соответствующими документами;по существу, набрав 100%.

Это правда или я что-то упустил?

1 Ответ

1 голос
/ 21 декабря 2010

Вы немного запутались в концепции точности.

Простым примером будет поиск терминов iraq war.В зависимости от того, как устроен поисковый движок и результаты могут совпадать или не совпадать с тем, что ищет пользователь.Это может вернуть

  • Войны, которые Ирак, страна вовлечена в
  • Вымышленная история о солдате в текущей войне в Ираке,
  • Статья новостей, которая говорито различных войнах и их финансовом воздействии.

Каждый документ может быть совершенно другим и содержать точные условия поиска, но может не иметь отношения к тому, что ищет пользователь.

Поисковая система определенно НРАВИТСЯ, чтобы иметь точность100%, но это очень редко.

Точность может быть определена ТОЛЬКО пользователем, который выполняет поисковый запрос, так как он единственный, кто без сомнения знает, что результат релевантен илине.Это определенно то, к чему нужно стремиться, но не верьте, что оно всегда будет равным 100%.

...