Я выполняю некоторую языковую обработку с помощью nltk. В этом проекте я использую цепочки Маркова в сочетании с POS, чтобы попытаться завершить предложения до конца. К сожалению, для добавления нового слова в цепях Маркова учитываются только последние 3 или 2 слова, поэтому значение завершаемого предложения недостижимо.
Как можно обойти это ограничение для автозаполнения предложениями, которые учитывают большую часть сообщения завершаемых предложений?