Можно ли отфильтровать «междометия» / «жужжание» в MS Speech-to-Text? - PullRequest
2 голосов
/ 15 января 2020

Мы экспериментируем с транскрибированием видеоматериалов с использованием (среди прочего) Microsoft Speech-to-Text (в частности, с использованием C# API). Результаты, которые мы получаем от Microsoft, часто содержат много «междометий» / «гудения» (неуверенных в правильности здесь термина), таких как «хмм», «хм» и т. Д. c., В то время как другие провайдеры, кажется, фильтруют это автоматически. В некоторых случаях может быть целесообразно включить их в результаты, но в других настройках было бы неплохо, если бы был способ настроить SpeechRecognizer для их исключения. Есть ли способ сделать это? 1004 * это?

1 Ответ

1 голос
/ 17 января 2020

Наш бэкэнд-движок обладает этой способностью. Однако в настоящее время это не публично задокументировано, и я не уверен, как вы отправите этот выбор от клиента в службу. Прямо сейчас это настройка по умолчанию для некоторых конечных точек, но не для других («inte rnet search» в сопоставлении с «dictation»).

Мне нужно будет поговорить с одним из наших сервисных инженеров, чтобы узнать, если это Можно динамически изменить это с клиента и получить более качественный ответ.

Спасибо,

Брайан.

--- Обновление ---

Я разговаривал с одним из наших сервисных инженеров, и эта функция называется форматированием TrueText. Я немного покопался в наших тестах и ​​документации, и это публично задокументировано здесь.

https://docs.microsoft.com/en-us/dotnet/api/microsoft.cognitiveservices.speech.propertyid?view=azure-dotnet

https://docs.microsoft.com/en-us/dotnet/api/microsoft.cognitiveservices.speech.speechconfig?view=azure-dotnet

Пример того, как вызвать / установить это для объекта SpeechConfig, будет выглядеть следующим образом ...

        var trueText = "TrueText";
        myDefaultConfig.SetProperty(PropertyId.SpeechServiceResponse_PostProcessingOption, trueText);

Документы в настоящее время не показывают другое состояние, которое я считаю "Нормальным" вместо "TrueText". Я постараюсь найти время на этой неделе, чтобы попробовать это сам и улучшить документацию по этому свойству id.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...