Как я могу учесть вес в алгоритме PageRank сетиx? - PullRequest
1 голос
/ 26 января 2012

Я думаю, что я делаю это сейчас неэффективно и хотел предложить, как это сделать лучше.В настоящее время у меня есть ориентированный граф, и я использую специфичные для узла факторы (то есть анализирую узлы, а затем присваиваю баллы ребрам между ними).У меня много факторов, и я постоянно меняю вес ребер (в моем случае, чем больше вес, тем лучше).

Но это зависит от узла, я также хотел использовать структуру графа, чтобы сделать выводы какхорошо (больше ребер должно дать узлу лучшее ранжирование и т. д.).

Моя проблема в том, что это два разных процесса, которые происходят, и я хочу посмотреть, смогу ли я как-то объединить их вместе, чтобы сделать выводы.Прямо сейчас я запускаю PageRank на моих узлах (каждый набор узлов делится на мои дни, поэтому я запускаю PageRank на всем наборе данных, а затем собираю только результаты за текущий день), затем берут оценки PageRank на текущий день и добавляем ихсумма всех весов от различных ребер до узлов.Это немного сбивает с толку, и мне было интересно, есть ли другой способ или я могу заставить PageRank учесть вес ребер (или что-то еще .. Я могу легко изменить программу)?

Мой страх с моим текущим подходомТак как я добавляю больше факторов для изучения для каждого узла, оценки будут увеличиваться (каждый узел добавляет значение в диапазоне от 0 до 1), но оценки PageRank остаются небольшими, поэтому, если у узла есть оценка 25, а PageRank - 0,034, тоОтносительно оценки PageRank не будет играть большую роль в выводе на график.

Любая помощь или предложения будут полезны.Я немного читал графики, но я все еще n00b, поэтому, пожалуйста, исправьте все мои неверные предположения.Также, если это поможет, я использую библиотеку python и networkx для своего графика.

1 Ответ

2 голосов
/ 26 января 2012

Если ваша основная задача - это относительный вес между оценками узлов и рангами страниц, не могли бы вы просто изменить их вес, чтобы получить правильный баланс? Например, вместо суммирования факторов для оценки, если вы использовали среднее значение, то количество факторов не будет проблемой.

...