Мне нужен подходящий алгоритм взвешивания, чтобы вернуть наиболее релевантные токены для запроса ... Я сгенерировал токены с помощью Lucene 3.0 ..., подумав об использовании концепции tf-idf? Может кто-нибудь предложить лучший алгоритм или модифицированный tf-idf?