У меня есть веб-приложение, написанное со стандартными ASP. net и javascript, и я хотел бы, чтобы оно записывало пользователя с микрофона и показывало транскрипцию во время выполнения. Я хотел бы знать, как я могу использовать API преобразования речи в текст Google. Мне нужен этот API https://cloud.google.com/speech-to-text/docs/streaming-recognize, но в javascript. Все примеры на этой странице относятся к языкам на стороне сервера.
Я изучал клиентские библиотеки Google API https://github.com/google/google-api-javascript-client, но там говорится, что они не поддерживают протокол gRP C, необходимый для потоковая передача.
В документации говорится, что вы можете делать вызовы gRP C напрямую, но я бы предпочел этого избежать.
Кто-нибудь знает, как это сделать? как реализована демонстрация Google? Я имею в виду вот этот «Привести в действие преобразование речи в текст»: https://cloud.google.com/speech-to-text
Кроме того, есть ли у кого-нибудь хороший опыт работы с другим API преобразования речи в текст, например