Как работает Google Speech API SingleUtterance
?Согласно документам, это способ Google определить, когда спикер произнес одно высказывание.Я понимаю, что он делает, но я хотел бы знать, как?API просто ожидает определенную продолжительность "безмолвного" звука?Если это так, как долго длительность беззвучного звука вызовет конец речи?
Есть ли у него какой-нибудь другой алгоритм ИИ, который помогает определить, когда кто-то перестал говорить?
Спасибо