Thuat Nguyen 10 января 2020 76

Какова идея или алгоритм нахождения n-граммы в NLTK?

1 Ответ

Colten Fowler / 30 января 2020

Вы можете перебирать пары / триплеты / последовательности n-длины слов в предложении в виде кортежей, используя zip.

for s in sentences:
    for w1, w2 in zip(s, s[1:]):
        bigram = w1, w2

...