Добавление метаданных к словам в word2vec - PullRequest
0 голосов
/ 20 декабря 2018

У меня есть модель word2vec, и я хочу изменить ее, добавив некоторые дополнительные данные помимо появления самого слова.

Например:

Категория (из предопределенных 50),POS и т. Д.

Я думал о двух способах сделать это:

  1. Просто сопоставить метаданные со словом.(так что слово «стол» будет закодировано как «стол-мебель-существительное»
  2. Лучший способ, на мой взгляд: создать новую функцию потерь, которая будет функцией совпадений словасамо по себе, совпадения категории, POS совпадения и т. д.

Итак, мои вопросы таковы: 1. Что будет лучше? 2. Как я могу создать новую потерюи оптимизировать его в Word2Vec? Могу ли я просто передать параметр в Word2Vec от Gensim или мне нужно с нуля построить новую модель Word2vec?

...