Я тренирую свои собственные векторы встраивания, так как я сосредоточен на академическом наборе данных (WOS);генерируются ли векторы с помощью word2vec или fasttext, не имеет особого значения.Скажем, мои векторы по 150 измерений каждый.Мне интересно, каким должно быть желаемое распределение весов внутри вектора, если вы усреднили по векторам всего корпуса?
Я провел несколько экспериментов, просматривая распределения выборки моих векторов, и пришел к следующим выводам (неуверенно относительно того, как они абсолютно верны):
Если кто-то тренирует свою модель слишкомПосле нескольких эпох векторы значительно не изменятся от начальных значений (это легко увидеть, если вы начинаете свои векторы как вес 0 в каждой категории).Таким образом, если мое распределение веса сосредоточено вокруг некоторой точки (обычно 0), то я недостаточно тренировал свой корпус.
Если тренировать свою модель со слишком малым количеством документов / переучиваний, то векторы показывают значительную корреляцию друг с другом (я обычно визуализирую случайный набор векторов, и вы можете видеть полосы, где все векторы имеют веса, которыеположительный или отрицательный).
Я представляю, что один «хороший» вектор имеет различные веса во всем диапазоне от -1 до 1. Для любого отдельного вектора он может иметь значительно больше измерений около -1 или 1. Однако распределение весаиз всего корпуса будет уравновешивать векторы, которые случайным образом имеют больше значений в направлении одного конца спектра или другого, так что распределение веса всего корпуса приблизительно равномерно распределено по всему корпусу.Правильна ли эта интуиция?