Я просмотрел несколько блогов для своего проекта и извлек несколько функций, таких как длина документа, в ссылках, в ссылках. Каждый из этих блогов рассказывает о какой-то конкретной теме, и может быть множество статей по каждой теме, и мне нужно выбрать не более одного или двух важных блогов для каждой темы. Как я могу присвоить веса этим функциям, чтобы выбрать важные блоги?
Я могу использовать алгоритм машинного обучения, но существуют миллионы блогов, и я не хочу их комментировать. Существует ли математически проверенный метод определения веса?
Спасибо
Bala