Определение весов для параметров (аналог Google pagerank) - PullRequest
0 голосов
/ 23 сентября 2010

Я просмотрел несколько блогов для своего проекта и извлек несколько функций, таких как длина документа, в ссылках, в ссылках. Каждый из этих блогов рассказывает о какой-то конкретной теме, и может быть множество статей по каждой теме, и мне нужно выбрать не более одного или двух важных блогов для каждой темы. Как я могу присвоить веса этим функциям, чтобы выбрать важные блоги?

Я могу использовать алгоритм машинного обучения, но существуют миллионы блогов, и я не хочу их комментировать. Существует ли математически проверенный метод определения веса?

Спасибо
Bala

1 Ответ

0 голосов
/ 23 сентября 2010

Одно предложение: при определении ранга A определите, сколько страниц относится к A.

...