Как получить sparse.csr_matrix, когда идентификатор пользователя и идентификатор продукта не являются числовыми? - PullRequest
0 голосов
/ 19 февраля 2019

Я пытаюсь создать систему рекомендаций, для которой мне нужно создать разреженную матрицу.Я пытаюсь с sparse.csr_matrix, но проблема в том, что мой идентификатор пользователя и идентификатор продукта не числовые, например, 34f7653-2de.

Я пытаюсь использовать следующий код после преобразования типа данных в категориальный.Я также пытался с sparse.coo_matrix

SUI = sparse.csr_matrix((train['item_count'].astype(float), (train['user_id'], train['item_id'])))

, показывая следующую ошибку:

TypeError: Категориальная не упорядочена для операции max, вы можете использовать .as_ordered (), чтобы изменитьКатегорически к заказанному

Есть ли способ сделать этот нечисловой идентификатор пользователя и идентификатор продукта?

1 Ответ

0 голосов
/ 03 марта 2019

Нам нужно преобразовать эти не числовые идентификаторы в числовые идентификаторы.Мы можем сделать это с помощью следующего кода.

user_id = user_id.astype('category').cat.codes
...