Я думаю, что многим здесь не хватает простоты вопроса. Он ничего не сказал о создании системы прогнозирования рейтинга. Он просто хочет вычислить сходство между поведением рейтинга песни каждого пользователя и поведением рейтинга песни каждого пользователя. Коэффициент корреляции Пирсона дает именно это. Да, вы должны перебирать каждую пару пользователь / пользователь.
EDIT:
Подумав об этом еще немного:
Пирсон - это замечательно, если вы хотите сходства между вкусами двух пользователей, но не их уровнем «самоуверенности» ... один пользователь, который оценит серию песен 4, 5 и 6, будет отлично соотноситься с другим пользователем, который оценивает одни и те же песни 3, 6 и 9. Другими словами, они имеют один и тот же «вкус» (они оценивают песни в одинаковом порядке), но второй пользователь гораздо более самоуверенный. Другими словами, коэффициент корреляции рассматривает любые два вектора рейтинга с линейной зависимостью как равные.
Однако, если вы хотите подобия между фактическими оценками, которые пользователи дали каждой песне, вы должны использовать среднеквадратичную ошибку между двумя векторами рейтинга. Это показатель, основанный исключительно на расстоянии (линейные отношения не играют на оценку сходства), поэтому пользователи 4,5,6 и 3,6,9 не будут иметь идеального показателя сходства.
Решение сводится к тому, что вы подразумеваете под "подобным" ...
Это все.