Для моего текущего проекта я ищу платформу для сборки ботов со следующими функциями:
Должна поддерживать создание / обновление нового / существующего бота через API.
Поддержка обнаружения намерений при потоковой передаче звука.
Включение размещения нескольких бот-агентов в одном проекте.
API для изменения существующего бота / агента и сохранения его как нового.
Поэтому я тщательно исследовал и разработал простой рабочий прототип с использованием DialogFlow.DialogFlow поддерживает обнаружение намерений от потокового аудио.Но пункты 1 и 3 не поддерживаются.DialogFlow на данный момент не поддерживает создание агента через API.Более того, самым большим ограничением является то, что для каждого проекта GCP может быть создан только один агент DialogFlow.Допустим, у меня создано несколько проектов agent-gcp.У меня также работает веб-приложение, которое получает аудиопотоки через WebSocket от другого внешнего ресурса для обнаружения намерений.Чтобы направить аудиопоток к конкретному встроенному агенту DialogFlow, мне нужно разрешить учетные данные во время выполнения для этого конкретного проекта GCP.Я прочитал, что могу создать учетную запись службы и управлять несколькими проектами GCP с помощью одного удостоверения, но это еще предстоит попробовать.
Также, как того требует пункт 4, я также ищу способ создания новых версий существующего агента во время выполнения с использованием API.В настоящее время DialogFlow поддерживает версии и среды, но реальная цель этого не так, как я упоминал.Кроме того, это бета-функция и не уверен, будет ли она когда-либо включена в производство.
С другой стороны, я изучал AWS Lex.Лекс поддерживает все, кроме одного моего требования.На данный момент AWS Lex не поддерживает обнаружение намерений из потока (я не смог найти API для этого).
Итак, мой вопрос: как я могу использовать существующие функции DialogFlow для удовлетворения моих требований?Или в AWS Lex есть способ определить намерение потокового аудиовхода?