Как мне предсказать жанр фильма на основе его описания, используя word2vec в Tensorflow?
Я уже импортировал данные IMDB, чтобы получить все описания и жанры в виде текста. Первым делом я извлек в словарь только жанры, поэтому каждый жанр имеет представление в виде int, например, genres = {0: "action", 1: "comedy", ..}. Теперь я могу построить один горячий вектор, как это:
def to_one_hot(data_point_index, vocab_size):
temp = np.zeros(vocab_size)
temp[data_point_index] = 1
return temp
Вектор для жанра "action" будет выглядеть так [1,0,0,0,0, ..., 0]. Как мне теперь продолжить описания? Я действительно не знаю, как справиться с ними. Там много слов в одном описании и много описаний тоже. Как мне обращаться с word2vec относительно описаний?