Форматирование результатов распознавания речи Microsoft (норвежский) - PullRequest
0 голосов
/ 21 января 2020

В наших текущих экспериментах с транскрибированием видеоматериалов с использованием различных поставщиков преобразования речи в текст Microsoft, похоже, является сильным соперником в отношении фактического распознавания слов. Для материалов Engli sh форматирование / пунктуация также довольно хорош, но для материалов на норвежском языке (что наиболее актуально для нас) вряд ли есть какое-либо форматирование / пунктуация вообще. Мы используем C# API SpeechRecognizer, где config.SpeechRecognitionLanguage имеет значение "nb-NO", config.OutputFormat имеет значение OutputFormat.Detailed и используется config.RequestWordLevelTimestamps (). Есть ли что-то, что мы можем сделать для улучшения форматирования результатов?

Кроме того, при извлечении отдельных слов с метками времени (что является одним из наших требований) нет форматирования даже с материалами Engli sh. Есть ли какая-нибудь опция, которую мы можем установить для сохранения форматирования / пунктуации при извлечении отдельных слов?

С наилучшими пожеланиями, Гуннар

1 Ответ

1 голос
/ 31 января 2020

Поддержка форматирования речи Microsoft для результатов nb-NO действительно очень проста c на данный момент. Результаты отображения имеют базовое c числовое форматирование и явную пунктуацию по запросу. Microsoft речь активно работает над улучшением автоматики c пунктуации и заглавных букв, чтобы улучшить результаты. Что касается временных меток, в настоящее время он не производит временные метки для уровня отображения. Это может быть поддержано в будущем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...