Я пытаюсь получить транскрипцию в реальном времени для видео, записанного в браузере с помощью webRT C. Вариант использования - это в основном субтитры в реальном времени, как в Google Hangouts.
Итак, у меня в браузере работает программа WebRT C. Он отправляет объекты webm обратно на сервер. Это линейные32 аудиокодировки. Google речь к тексту принимает только файлы linear16 или Fla c.
Есть ли способ конвертировать linear32 в linear16 в реальном времени?
Иначе кто-нибудь смог соединить webRT C с речью Google, чтобы заставить работать транскрипцию в реальном времени?
Любой совет о том, где искать решение этой проблемы, был бы великолепен