Question

Как работает Google Speech API SingleUtterance?Согласно документам, это способ Google определить, когда спикер произнес одно высказывание.Я понимаю, что он делает, но я хотел бы знать, как?API просто ожидает определенную продолжительность "безмолвного" звука?Если это так, как долго длительность беззвучного звука вызовет конец речи?

Есть ли у него какой-нибудь другой алгоритм ИИ, который помогает определить, когда кто-то перестал говорить?

Спасибо

rsantiago · Answer 1 · 04 октября 2018

Я не думаю, что детали раскрыты, на мой взгляд, определение окончания звука - это решение API. Вместо этого он предлагает способ определить, когда такое решение было принято.

В нормальных условиях поток будет продолжать слушать и обрабатывать аудио до тех пор, пока либо поток не будет закрыт напрямую, либо не будет превышена предельная длина потока . В такой ситуации single_utterance не требуется устанавливать.

Когда вам это требуется (например, голосовые команды) и задаете single_utterance = true, API решает, когда завершить распознавание, и отправляет вашему клиенту событие END_OF_SINGLE_UTTERANCE и прекращает распознавание.

Google Speech API Single Utterance

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Google Speech API Single Utterance

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы