Я работаю над проектом рекомендаций, где у меня есть данные, подобные этим:
ID Movie
1 A
2 B
3 C
4 D
..
..
Я хочу создать этот кадр данных в разреженной матрице, подобной этой:
1 2 3 4 ....n
1 1 0 0 0 0
2 0 1 0 0 0
3 0 0 1 0 0
4 0 0 0 1 0
.
.
n 0 0 0 0 1
В основном обаСтроки и столбцы содержат идентификатор перемещения, и значение равно 1, если элемент строки и столбца имеет одинаковое значение.Я хочу представить это в разреженном формате
<sparse matrix of type '<class 'numpy.int32'>'
with 58770 stored elements in Compressed Sparse Row format>
Я попытался сделать следующее:
- np.diag(items)
- csr_matrix(items.values)
Но я не могу понять это.Кто-нибудь может мне помочь?