Я создаю агрегатор блогов, такой как Techmeme , который находит наиболее популярные посты из нескольких блогов. В отличие от Techmeme, сначала я собираю сообщения в блогах из различных RSS-каналов, а затем сохраняю заголовки и соответствующие URL-адреса в базе данных. После этого я должен найти, какие самые популярные записи в блоге .
Чтобы определить главные заголовки постов в блоге, я отслеживаю подсчет общего ресурса в Facebook и Twitter для каждого поста каждого блога и оцениваю посты в блоге по их количеству. Но это не лучшее решение, потому что некоторые блоггеры могут обманывать, увеличивая количество своих сообщений с помощью мошеннических акций.
Итак, мой вопрос, какие критерии я могу использовать, чтобы определить, какие сообщения наиболее популярны?
Какой будет лучший алгоритм для ранжирования сообщений в блоге?