Предсказать жанр фильма по описанию, используя word2vec в тензорном потоке - PullRequest
0 голосов
/ 02 июля 2019

Как мне предсказать жанр фильма на основе его описания, используя word2vec в Tensorflow?

Я уже импортировал данные IMDB, чтобы получить все описания и жанры в виде текста. Первым делом я извлек в словарь только жанры, поэтому каждый жанр имеет представление в виде int, например, genres = {0: "action", 1: "comedy", ..}. Теперь я могу построить один горячий вектор, как это:

def to_one_hot(data_point_index, vocab_size):
    temp = np.zeros(vocab_size)
    temp[data_point_index] = 1
    return temp

Вектор для жанра "action" будет выглядеть так [1,0,0,0,0, ..., 0]. Как мне теперь продолжить описания? Я действительно не знаю, как справиться с ними. Там много слов в одном описании и много описаний тоже. Как мне обращаться с word2vec относительно описаний?

...