Возникла проблема при вызове функции AudioConfig.FromWavFileInput через библиотеку python - PullRequest
0 голосов
/ 28 декабря 2018

Я пытаюсь обработать файл .wav с помощью службы когнитивной речи Azure.Я использую скрипт ниже.Я получаю исключение, которое говорит, что «объект типа« AudioConfig »не имеет атрибута« FromWavFileInput »», когда я пытаюсь настроить файл wav, вызывая AudioConfig.FromWavFileInput () .В документации сказано, что функция существует, по крайней мере, в библиотеке .net.Существует ли FromWaveFileInput для библиотеки cognitiveservices-speech ?Как я могу обработать аудиофайл с помощью Python?

import azure.cognitiveservices.speech as speechsdk

speechKey = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
service_region = 'eastus2'

#### # Creates an instance of a speech config with specified subscription key and service region.
#### # Replace with your own subscription key and service region (e.g., "westus").
speech_config = speechsdk.SpeechConfig(subscription=speechKey, region=service_region)

audioInput = speechsdk.AudioConfig.FromWavFileInput('RainSpain.wav')

#### # Creates a recognizer with the given settings
speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config, audio_input=audioInput)

1 Ответ

0 голосов
/ 31 декабря 2018

Действительно, как вы сказали.Я искал ключевые слова AudioConfig & FromWavFileInput в GitHub repo Azure-Samples/cognitive-services-speech-sdk, там нет никаких кодов Python, кроме Java, C # и C ++ .

Итак, по моему опыту, есть два обходных пути сделать это.

  1. Обернуть коды C ++ как модуль расширения Python или общаться с кодами C ++ / Java.
  2. Непосредственное использование API REST службы речевой службы с requests, это просто для Python и Azure Speech Service.
...