Управление выводом звука из текста в речь в Microsoft WebChat - PullRequest
0 голосов
/ 19 марта 2020

Я использую Microsoft WebChat для подключения к своей службе ботов, и большинство взаимодействий в основном голосовые. Я использую Azure Speech Services, и голосовой вывод полностью обрабатывается WebChat. В настоящее время я отправляю неактивное событие в бот, который запрашивает неактивного пользователя, если вход не был получен после установленной продолжительности. Это делается на основе входящей активности. Однако в сценарии, управляемом голосом, событие отправляется иногда, пока бот все еще произносит сообщение, потому что, хотя сообщение не было озвучено полностью, неактивное событие отправляется в зависимости от того, когда была получена входящая активность. Я хотел бы отправить неактивное приглашение 'n' секунд после того, как каждое сообщение было озвучено, но для этого мне нужно было бы знать продолжительность воспроизведения каждого сообщения. Есть ли способ получить продолжительность вывода каждого голосового сообщения, предоставляемого службой преобразования текста в речь, чтобы я мог отправить неактивное приглашение в нужное время?

1 Ответ

0 голосов
/ 24 марта 2020

В настоящее время, что касается веб-чата, нет способа зафиксировать продолжительность речи. Я бы порекомендовал отправить это как запрос на добавление функций для дальнейшего развития, если вы хотели бы, чтобы это было включено. Вы можете сделать это здесь .

Это является функцией когнитивных служб через их REST API (см. здесь ), и, по-видимому, через SDK (см. здесь ). Возможно, вы сможете интегрировать речевой STT / TTS непосредственно в ваш проект, чтобы использовать свойство «duration», доступное в объекте ответа.

Надежда на помощь!

...