Я планирую создать расширение Chrome с Javascript, чтобы иметь возможность транскрибировать аудио в текст (приложение речи в текст) с помощью Microsoft Azure Cognitive Services .
Дело в том, что я хочу предоставить этому расширению URL, указывающий на файл MP3 для транскрибирования. До сих пор я видел здесь , что для Javascript SDK вы можете указать транскрибировать аудио из файла WAV (SpeechSDK.AudioConfig.fromWavFileInput
) или используя микрофон в качестве источника (SpeechSDK.AudioConfig.fromDefaultMicrophoneInput
), но было бы здорово, если бы этого можно было достичь, предоставив что-то вроде Аудиообъекта .
Кто-нибудь знает, возможно ли это с помощью Cognitive Services?
Спасибо за заранее!