Как подготовить разреженные данные для построения автоэнкодера в TF? - PullRequest
0 голосов
/ 01 мая 2018

У меня есть кортежи user-item-rating. Пользователи и элементы в настоящее время являются строками (либо хеш-кодами, либо текстовыми строками, названиями книг или фильмов). Рейтинги являются целыми числами. Я пытаюсь выяснить преобразование данных, необходимое для получения этих оценок в TF для создания автоэнкодера.

Допустим, у меня есть 100 000 возможных предметов. Я думаю, что я должен кормить модель разреженными тензорами, где каждая мини-партия будет набором оценок элементов пользователя. Нужно ли преобразовывать строки элементов в целочисленные идентификаторы, чтобы сделать это? Кроме этого, есть ли какие-либо другие детали, которые я должен знать?

...