при вычислении сочетаемости двух слов мы разделяем предложения или связываем все предложения? - PullRequest
1 голос
/ 24 июня 2019

Например, я получаю документ, который содержит 2 предложения: я человек. Он также любит яблоки. Нужно ли нам посчитать совпадение «человек» и «он»?

1 Ответ

1 голос
/ 28 июня 2019

Каждый документ отделяется переводом строки.Контекстные окна случайностей ограничены каждым документом.

На основе реализации здесь .

Новая строка берется как указание нового документа (контексты не пересекаются с новой строкой).

Таким образом, в зависимости от того, как вы готовите предложения, вы можете получить разные результаты:

Настройка 1: ('He', 'person') в смешанном режиме

...
I am a person. He also likes apples.
...

Настройка 2: ('He', 'person') не в сочетании

...
I am a person. 
He also likes apples.
...
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...