Я использую модель Alternating Least Squares из библиотеки Implicit в наборе данных LastFM, рекомендуя исполнителей различным пользователям.
Мне сложно интерпретировать список рекомендуемых исполнителей и партитур.
Многие баллы, кажется, колеблются около 1.1
, например:
model_als.recommend(user_id, user_item_matrix)
artist score
0 npr 1.204484
1 brian wilson 1.190483
2 neil young & crazy horse 1.147750
3 sly & the family stone 1.141859
4 the beta band 1.132374
5 the band 1.128185
6 elvis costello & the attractions 1.118344
7 david byrne 1.114423
8 charlie parker 1.105284
9 mark mothersbaugh 1.103784
Какой здесь «лучший» результат? Самый низкий или самый высокий? И каков масштаб / диапазон оценок? Показатель 1.10
выше 2 из 2? Или из 100? Какой самый низкий балл? Стоит ли вообще игнорировать эти результаты?
Я везде гуглил и не могу найти однозначного ответа даже на странице библиотеки github.
Я также подсчитал количество похожих пользователей на другого пользователя и набрал go до 40-х годов. Что смутило меня еще больше.
model_als.similar_users(user_id)
users similar to 178141 score
0 336798 43.835110
1 205426 41.776321
2 104129 41.578308
3 328411 41.425632
4 113997 41.309204
5 229685 41.287209
6 147693 41.177387
7 34985 41.175827
8 264109 41.130024
9 306444 41.095680