Допустим, у вас есть корпус размером n
размер окна m
, так что общий размер окна, рассматриваемый в данный момент времени, равен 2m+1
. Тогда число пропущенных грамм будет
2m (n-2m)
Давайте рассмотрим простой пример:
[I like to go to the beach in the winter]
Здесь мы имеем n=10
и предположим m=3
, Тогда вы получите,
2m (n-2m) = 24
И пары слов,
go, [I | like | to | to | the | beach]
to, [like | to | go | the | beach | in]
the, [to | go | to | beach | in | the]
beach, [go | to | the | in | the | winter]
Что составляет 24
PS : Это дает количество положительных образцов скип-граммы. Если вам нужно это с отрицательным, это будет,
2m (n-2m) + (n-2m)[n - (2m + 1)] = (n-2m)(n - 1)