Я хочу понять, что означает каждое измерение в выводе word2vec.
Например, если я создаю дерево решений с одной горячей закодированной переменной, я могу точно сказать, какая категория в категориальной переменной отвечает зарасколОднако, если я использую вложения, я не могу объяснить причину этих расщеплений.
Мне известен известный пример вложения (король) - вложение (мужчина) + вложение (женщина) = вложение (королева),Из этого примера мы можем сказать, что характеристика «роялти» была понята.
Я думаю, что можно было бы объединить сходные точки данных на основе косинусного сходства, чтобы получить некоторый контекст о том, что представляют собой выходные функции.
Например, если я получу 3 ближайших соседа точки данных: «Километр», «Дюйм» и «Миля». Я мог бы заключить, что «Длина» может быть причиной разделения в дереве решений. Однако мне было интересно, был ли другой путь.