Где не использовать IDF? - PullRequest
3 голосов
/ 19 января 2011

В каких случаях обратная частота документов бесполезна при поиске информации?

1 Ответ

1 голос
/ 11 мая 2011

Возможно, вы не захотите использовать IDF, если в вашей системе вы не хотите взвешивать редкие термины тяжелее, чем часто встречающиеся. Кроме того, вычисление IDF является дорогостоящей операцией. Это видно из того факта, что в наиболее часто используемой схеме оценки, т. Е. Lnc.ltc, мы не вычисляем оценки idf для терминов, встречающихся в документе.

Более того, если ваша поисковая система обрабатывает только одно слово, использование idf бесполезно, как если бы оно было одинаковым для каждого документа. Надеюсь, это поможет

...