Word2Vec + Регрессия - Численный метод оценки - PullRequest
0 голосов
/ 04 июля 2018

Я хотел бы построить нейронную сеть с группами слов и числовых значений в качестве входных данных и числового значения в качестве выходных.

Для этой цели, я думаю, наиболее подходящим решением было бы использование алгоритма Word2Vec для групп слов, чтобы получить вложения, а затем обучить нейронную сеть (вероятно, LSTM) с ними и другими входами / выходами .

Но как этого добиться, пожалуйста? Поскольку для каждого слова существует один вектор весов (благодаря алгоритму Word2Vec), как обучить нейронную сеть для прогнозирования числовых значений (регрессия, другими словами)? Или, по крайней мере, как я мог преобразовать этот вектор весов в значащее числовое значение? (На самом деле я не знаю, как обучить нейронную сеть с векторами числовых значений и «простыми» числовыми значениями вместе.)

Я пытался проверить эти концепции в Интернете, но я не нашел очень подходящих статей для своих целей. Вот некоторые из них:

-Вложение вложения с логистической регрессией

https://machinelearningmastery.com/use-word-embedding-layers-deep-learning-keras

https://pdfs.semanticscholar.org/8eb6/74c76fc471e9cf815921b6329eb4a1bbed30.pdf

1 Ответ

0 голосов
/ 04 июля 2018

Обычно вы используете алгоритм расстояния, такой как косинусное сходство , чтобы вычислить расстояния между векторами. Чем короче расстояние, тем больше похожи ваши слова.

...