Что вы можете сделать, это проверить каждую позицию в тексте (я бы рекомендовал начинать с позиции 2) сравнить, если следующее слово, присутствующее в тексте, входит в число наиболее вероятных следующих слов в соответствии с моделью, например:
"Трансформатор взял естественную обработку штурмом [...]"
- Первая итерация:
Ввод: "Трансформатор МАСКА "
Сравнить: МАСКА /" Иметь "
Вторая итерация:
Ввод: «Трансформер взял МАСКУ»
Сравнение: МАСКА / «the»
Третья итерация:
Ввод: "Трансформер взял МАСКУ"
Сравнение: МАСКА / "of" - Здесь вы, вероятно, имели бы очень низкую вероятность. Это может помочь вам проверить, может ли это быть местом для пропущенного слова.
Этот пост поможет вам достичь этого программно: Прогнозирование пропущенных слов в предложении - Модель обработки естественного языка