Твиттер недавно объявил , что вы можете с высокой точностью аппроксимировать рейтинг любого данного пользователя Твиттера, введя их число подписчиков в следующей формуле:
exp ($ a + $ b * log (follower_count))
, где $ a = 21 и $ b = -1,1
Это, очевидно, намного эффективнее, чем сортировка всего списка пользователей по количеству подписчиков для данного пользователя.
Если у вас есть аналогичный набор данных с другого социального сайта, как вы могли бы получить значения для $ a и $ b, чтобы соответствовать этому набору данных? В основном некоторый список частот, распределение которых предполагается степенным законом.