Как работает node2vec - PullRequest
       10

Как работает node2vec

0 голосов
/ 26 ноября 2018

Я читал об алгоритме встраивания node2vec , и я немного запутался, как он работает.

Для справки, node2vec параметризован p и q и работает путем имитации группы случайных обходов от узлов и просто запускает вложения word2vec на этих обходах как «предложения».Установив p и q по-разному, вы можете получить больше случайных обходов типа BFS или DFS на этапе симуляции, захватывая различную структуру сети при внедрении.

Установка q> 1 дает нам больше поведения BFS в этомобразцы прогулок состоят из узлов в небольшой местности.Что меня смущает, так это то, что в статье говорится, что это эквивалентно внедрению узлов с похожими структурными свойствами, близкими друг к другу.

Я не совсем понимаю, как это работает.Если в моей сети есть два отдельных, скажем, структурированных узла типа звезда / концентратор, которые находятся далеко друг от друга, зачем встраивание, основанное на случайных блужданиях из этих двух узлов, сближает эти два узла в процессе встраивания?

1 Ответ

0 голосов
/ 27 ноября 2018

Этот вопрос занял мое мнение и после прочтения статьи, и, тем более, после того, как эмпирически выяснилось, что это действительно так.u и s6 результирующие вложения будут очень похожи в пространстве: enter image description here

Чтобы понять, почему это действительно происходит, сначала мы должны понять, как пропускаетграмм модель встраивает информацию, которая является механизмом, который потребляет случайные прогулки.Модель скип-граммы в конечном итоге генерирует подобные вложения для токенов, которые могут появляться в сходном контексте - но что это действительно означает с точки зрения модели скип-граммы?Если бы мы хотели внедрить структурную эквивалентность, мы бы предпочли обход по типу DFS (и дополнительно нам пришлось бы использовать адекватный размер окна для модели скип-граммы).Таким образом, случайные прогулки выглядят так:

1. s1 > u > s4 > s5 > s6 > s8
2. s8 > s6 > s5 > s4 > u > s1
3. s1 > s3 > u > s2 > s5 > s6
4. s7 > s6 > s5 > s2 > u > s3
.
.
n. .....

Что произойдет, так это то, что будет много прогулок, где u и s6 появляются на прогулках, где их окружение одинаковое.Поскольку их окружение будет схожим, это означает, что их контекст похож и, как указано, похожий контекст == похожие вложения.

Кто-то может спросить насчет порядка?Ну, порядок на самом деле не имеет значения, так как модель скип-граммы использует размер окна для генерации пар из каждого предложения, в приведенной мною ссылке вы сможете лучше понять эту концепцию.

Итак, если выможет создавать прогулки, которые создадут одинаковый контекст для двух узлов, их вложения будут одинаковыми.

...