Кто-нибудь знает, что Google News использует для их алгоритма кластеризации? - PullRequest
12 голосов
/ 22 сентября 2010

Любопытно, есть ли у кого-нибудь понимание того, какой алгоритм используются в новостях Google для группировки похожих историй? к-средства? или что-то нестандартное?

Ответы [ 2 ]

4 голосов
/ 23 сентября 2010

Я думаю, это довольно сложно выяснить; но пока я нашел этот хороший технический документ о возможных алгоритмах для предложений по персонализации Новостей Google. Посмотрите сами:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.80.4329&rep=rep1&type=pdf

Здесь рассматриваются три алгоритма: (1) MinHash кластеризация (2) Вероятностная скрытая семантическая индексация (3) Covisitation

и некоторые комбинации.

Надеюсь, эта информация была полезна!

1 голос
/ 30 августа 2012

Когда Google запускал Новости Google, они помещали небольшой раздел об алгоритмах, которые они использовали для группировки на странице «О новостях Google», там упоминалось «Продвинутая Байесовская сеть "и некоторые другие алгоритмы (имена других алгоритмов не упоминались!).Этот абзац теперь отсутствует на той же странице.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...