Сегментация предложений - это решение, которое я бы выбрал, предполагая, что у вас есть обучающие данные, разделенные для каждого намерения, и вы можете обучить сегментатор предложений (модель тегирования последовательности) на синтетически сгенерированных данных, просто увеличивая высказывания из каждого намерения.
Например, предполагая, что у нас есть 4 намерения с несколькими обучающими высказываниями, вы можете сгенерировать обучающий текст для сегментатора предложений, выбрав случайным образом число предложений «s_num», которое представляет, сколько намерений / предложений будет включено вэто обучающее высказывание, затем в соответствии с этим числом случайным образом выберите количество предложений "s_num" и сложите их вместе, создавая обучающий экземпляр для сегментера.
Метки могут быть следующими:
"Это предложение с намерением1 и это предложение с намерением2" ["Начало", "О", "О", "О", "END "," O "," Start "," O "," O "," O "," END "]