Azure Cognitives обеспечивает преобразование речи в текстовое распознавание числовых объектов как текста - PullRequest
0 голосов
/ 28 февраля 2019

Мне было интересно, возможно ли, чтобы C ++ SDK Cognitives обслуживал функцию «Речь в текст», чтобы возвращать числовые объекты в виде текста вместо чисел.

Текущий ответ «Я хочу заказать 2 кокса« Ожидаемый ответ »Iхочу заказать две колы

Конечно, я могу реализовать функцию перевода.Но мне было интересно, если это то, что сервис уже предоставляет.Особенно на испанском.

1 Ответ

0 голосов
/ 19 марта 2019

посмотрите на репозиторий примеров в https://github.com/Azure-Samples/cognitive-services-speech-sdk

, особенно файл speech_recognition_samples.cpp, функция SpeechRecognitionWithLanguageAndUsingDetailedOutputFormat

Включение «подробного вывода» даст вам желаемый результат:

config->SetOutputFormat(OutputFormat::Detailed);

Затем вам нужно взглянуть на подробный вывод:

result->Properties.GetProperty(PropertyId::SpeechServiceResponse_JsonResult)

И это создаст подробный вывод, подобный следующему:

{"Duration":35500000,"NBest":[{"Confidence":0.7535948753356934,"Display":"I want to order 2 Cokes.","ITN":"I want to order 2 cokes","Lexical":"i want to order two cokes","MaskedITN":"I want to order 2 cokes"}],"Offset":17000000,"RecognitionStatus":"Success"}

Возможно, лексический выводВы хотите

Вольфганг

...