Я пытаюсь разделить разные колонки в аудиозаписи, используя https://cloud.google.com/speech-to-text/docs/multiple-voices. Однако фрагмент кода не работает для аудиофайлов> 1 мин.Поддерживается ли эта функция или аудио-файл должен быть разделен?
Также API поддерживает любой другой (/ сжатый) формат, кроме wav?