Что могут означать слова с очень похожими вложениями? - PullRequest
0 голосов
/ 07 июля 2019

Я тренирую большой набор предложений с модулем tenorflow word2vec, и после того, как обучение завершено, сходство слов в терминах значений сходства косинусов очень велико. Например, если я ищу 50 лучших похожих слов, скажем, «математика» (которая является частью словаря), эти возвращенные слова имеют почти 0,9999 косинусного сходства с «математикой». Подобное имеет место с большинством других слов в корпусе. Это затрудняет поиск ближайших слов для данного слова. Что может пойти не так на тренировке? (Значение потери стабилизируется через некоторое время, близкое к 0, и можно предположить, что скорость обучения низкая, для обучения было достаточно эпох)

...