Отправить аудио в реальном времени на Bing Speech API - PullRequest
0 голосов
/ 25 мая 2018

Я пытаюсь использовать NAudio для получения голоса в реальном времени и отправки его в байтовом массиве в API речи Bing.

Я использовал обработчик событий для получения аудио и отправки в API речи Bing.Ниже приведен код, который я попробовал.

private void Source_DataAvailable(object sender, WaveInEventArgs e)
    {   //convert the sound into a byte array

        writer.Write(e.Buffer, 0, e.BytesRecorded);
         memoryStream = new MemoryStream(e.Buffer);
        CallSpeechAPI(memoryStream);

    }

Когда я попытался выполнить, мы получили следующий ответ:

Ответ: OK {"RecognitionStatus": "InitialSilenceTimeout", "Смещение ": 5000000," Продолжительность ": 0} Конец записи

Когда я попытался преобразовать существующий файл .wav в байтовый массив и отправить их в API, который работает нормально.Но для аудио в реальном времени мы сталкиваемся с этой проблемой.

Может кто-нибудь помочь, в чем будет проблема и как ее решить.

Также, если есть какая-либо возможность получить реальныйвремя аудио в байтовом массиве, пожалуйста, дайте мне знать?

Если есть пример кода, поделитесь им с нами.

Заранее большое спасибо

Ответы [ 2 ]

0 голосов
/ 29 июня 2018

Поддержка входного аудиопотока теперь доступна в новом Speech SDK v0.4.0 :.Вы можете найти образцы здесь .Вам просто нужно реализовать свои собственные AudioInputStream :: Read () и :: GetFormat () в соответствии с интерфейсом, описанным здесь .

Спасибо

0 голосов
/ 03 июня 2018

Мы будем поддерживать аудио поток через байтовый массив или io.stream в ближайшее время.Пожалуйста, не переключайтесь.Спасибо тебе за твое терпение.

...