У меня есть множество фильмов с оценками пользователей. Мне нужно вычислить два разных соотношения: «Элемент против элемента» (чтобы найти похожие фильмы) и «Пользователь против пользователя» (чтобы найти похожих пользователей). Элемент против элемента работает отлично, в то время как пользователь против пользователя возвращает NaN только для user0
!
В частности, для пользователя против пользователя:
correlationsT = dft.corr(min_periods=1)
Это то, что correlationsT
выглядит как
Так выглядит dft
(пользователь против пользователя)
Также проверил тип dft
, чтобы увидеть, что-то не так со столбцом 0:
user_id
0 float64
1 float64
2 float64
3 float64
4 float64
...
939 float64
940 float64
941 float64
942 float64
943 float64
Есть идеи?