Может ли word2ve c иметь дело с последовательностью чисел? - PullRequest
0 голосов
/ 14 марта 2020

Я очень плохо знаком с встраиванием в сеть, особенно для атрибутивного встраивания в сеть. В настоящее время я изучаю алгоритм node2ve c. Я думаю, что процесс

RandomWalk with p and q
Fed the walks to Word2Vec

На втором этапе я вижу, что алгоритм принимает каждый узел в виде строки.

Но моя проблема в том, что узлы моей сети являются значениями. Возможно, некоторые узлы имеют одинаковое значение. Я думаю, что эта стратегия будет принимать узлы с тем же значением, что и «один» узел.

Тогда что мне делать, если я хочу встроить такую ​​сеть? Моя сеть является приписанным графом, каждый узел имеет n размерных атрибутов.

Большое спасибо!

1 Ответ

0 голосов
/ 14 марта 2020

Я полагаю, что большинство приложений word2ve c к графам дают каждому узлу уникальный идентификатор, который затем используется в качестве токена «слова», поданного в алгоритм. Если у ваших узлов есть другие значения, которые повторяются, эти значения не являются идеальными в качестве идентификаторов узлов.

(Хотя word2ve c изначально не обрабатывает непрерывные величины, было проведено некоторое исследование, расширяющее его таким образом - например, я думаю, StarSpace 'Facebook позволяет смешивать скалярные функции с дискретными токенами традиционного word2ve c. Я полагаю, вы могли бы также рассмотреть объединение диапазонов ваших узлов 'скалярные измерения в дискретные токены, которые иногда можно использовать вместо идентификаторов, чтобы узнать вложения, с которыми может быть связан диапазон значений.)

...