Pagerank - Проблема - PullRequest
       14

Pagerank - Проблема

1 голос
/ 20 января 2011

Я покажу вам 2 сценария (NB d = коэффициент демпфирования = 0,5)

Первый сценарий : предположим, что есть 4 узла A, B, C, D:

  • B, C, D ссылка на A.

PageRank: PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

Я могу решить это уравнение, поставив 0.25 на PR(B)=PR(C)=PR(D), и яполучить значение 0,875.Мне не нужно разрешать никакую систему

Второй сценарий : предположим, что имеется 4 узла A, B, C, D:

  • A ссылка на B и C
  • B ссылка на C
  • C ссылка на A

Таким образомPageRank будет:

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

Я должен разрешить эту систему, чтобы получить результат.Я не ставлю 1/N на PR(A), PR(B), PR(C) and PR(D)

На самом деле, я ищу в интернете решение и значения:

$ PR (A) = 14/13 = 1.07692308$

$ PR (B) = 10/13 = 0,76923077 $

$ PR (C) = 15/13 = 1,15384615 $

Так почему же с двумя подобными сценариями яиспользовать 2 разных поведения?

Надеюсь, кто-нибудь может мне помочь :) Ура

Ответы [ 2 ]

1 голос
/ 19 октября 2013

Предположим, что небольшая вселенная из четырех веб-страниц: A, B, C и D. Ссылки со страницы на себя или несколько исходящих ссылок с одной страницы на другую, игнорируются.PageRank инициализируется одинаковым значением для всех страниц.В исходной форме PageRank сумма PageRank по всем страницам представляла собой общее количество страниц в Интернете на тот момент, поэтому каждая страница в этом примере имела бы начальный PageRank, равный 1. Однако более поздние версии PageRank иВ оставшейся части этого раздела предположим, что распределение вероятностей между 0 и 1. Исходное значение для каждой страницы составляет 0,25.

PageRank, перенесенный с данной страницы на цели своих исходящих ссылок после следующей итерации, делитсяпоровну среди всех исходящих ссылок.

Если бы единственные ссылки в системе были со страниц B, C и D на A, каждая ссылка передала бы 0,25 PageRank на A на следующей итерации, в общей сложности 0,75.

PR (A) = PR (B) + PR (C) + PR (D)

Предположим, что вместо страницы B была ссылка на страницы C и A, на странице C была ссылкана страницу А, а на странице D были ссылки на все три страницы.Таким образом, на следующей итерации страница B будет передавать половину своего существующего значения, или 0,125, на страницу A, а другую половину, или 0,125, на страницу C. Страница C будет передавать все свое существующее значение, 0,25, толькостраница, на которую он ссылается, A. Поскольку у D было три исходящих ссылки, он перенесет одну треть своего существующего значения, или приблизительно 0,083, в A. По завершении этой итерации страница A будет иметь PageRank 0,458.

PR (A) = \ frac {PR (B)} {2} + \ frac {PR (C)} {1} + \ frac {PR (D)} {3}. \,

Другими словами, PageRank, присвоенный исходящей ссылке, равен собственной оценке документа PageRank, деленной на количество исходящих ссылок L ().

PR (A) = \ frac {PR (B)} {L (B)} + \ frac {PR (C)} {L (C)} + \ frac {PR (D)} {L (D)}.

В общем случае значение PageRank для любой страницы u может быть выражено как:

PR (u) = \ sum_ {v \ in B_u} \ frac {PR (v)}{L (v)},

т.е. значение PageRank для страницы u зависит от значений PageRank для каждой страницы v, содержащейся в наборе Bu (набор, содержащий все страницы, ссылающиеся на страницу u), деленное наколичество L (v) ссылок со страницы v.

Для дальнейших запросов посетите здесь

1 голос
/ 20 января 2011

Два сценария различаются из-за симметрии в первой задаче: B, C и D ссылаются на одни и те же страницы и связаны с ними (т.е. все они указывают на A, и ничто не указывает на них).Поэтому их рейтинг страниц будет таким же, это дает вам дополнительное ограничение, что PR (B) = PR (C) = PR (D), что позволяет вам легко решить проблему.

Вторая проблема не имеетсимметрия и должна быть решена длинной рукой.

...