У меня есть модель word2vec, и я хочу изменить ее, добавив некоторые дополнительные данные помимо появления самого слова.
Например:
Категория (из предопределенных 50),POS и т. Д.
Я думал о двух способах сделать это:
- Просто сопоставить метаданные со словом.(так что слово «стол» будет закодировано как «стол-мебель-существительное»
- Лучший способ, на мой взгляд: создать новую функцию потерь, которая будет функцией совпадений словасамо по себе, совпадения категории, POS совпадения и т. д.
Итак, мои вопросы таковы: 1. Что будет лучше? 2. Как я могу создать новую потерюи оптимизировать его в Word2Vec? Могу ли я просто передать параметр в Word2Vec от Gensim или мне нужно с нуля построить новую модель Word2vec?