Я понимаю, что частота терминов по умолчанию (tf) просто рассчитывается как квадрат числа раз, когда конкретный искомый термин появляется в поле.Таким образом, документы, содержащие несколько вхождений термина, по которому вы ведете поиск, будут иметь более высокое значение tf и, следовательно, вес.
В чем я не уверен, так это в том, поможет ли это увеличить оценку документов, поскольку весбольше или уменьшает баллов документов, потому что он перемещает вектор документа от вектора запроса, как кажется, говорит книга «Поиск в спящем режиме» (стр. 363).Признаюсь, я действительно изо всех сил пытаюсь увидеть, как векторная модель документа согласуется с уравнением оценки люцены