Как интерпретировать оценки в системе неявных рекомендаций? Чередование наименьших квадратов - PullRequest
0 голосов
/ 27 января 2020

Я использую модель Alternating Least Squares из библиотеки Implicit в наборе данных LastFM, рекомендуя исполнителей различным пользователям.

Мне сложно интерпретировать список рекомендуемых исполнителей и партитур.

Многие баллы, кажется, колеблются около 1.1, например:


 model_als.recommend(user_id, user_item_matrix)

                             artist     score
0                               npr  1.204484
1                      brian wilson  1.190483
2          neil young & crazy horse  1.147750
3            sly & the family stone  1.141859
4                     the beta band  1.132374
5                          the band  1.128185
6  elvis costello & the attractions  1.118344
7                       david byrne  1.114423
8                    charlie parker  1.105284
9                 mark mothersbaugh  1.103784

Какой здесь «лучший» результат? Самый низкий или самый высокий? И каков масштаб / диапазон оценок? Показатель 1.10 выше 2 из 2? Или из 100? Какой самый низкий балл? Стоит ли вообще игнорировать эти результаты?

Я везде гуглил и не могу найти однозначного ответа даже на странице библиотеки github.

Я также подсчитал количество похожих пользователей на другого пользователя и набрал go до 40-х годов. Что смутило меня еще больше.


model_als.similar_users(user_id)

   users similar to 178141      score
0                   336798  43.835110
1                   205426  41.776321
2                   104129  41.578308
3                   328411  41.425632
4                   113997  41.309204
5                   229685  41.287209
6                   147693  41.177387
7                    34985  41.175827
8                   264109  41.130024
9                   306444  41.095680
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...