В наших текущих экспериментах с транскрибированием видеоматериалов с использованием различных поставщиков преобразования речи в текст Microsoft, похоже, является сильным соперником в отношении фактического распознавания слов. Для материалов Engli sh форматирование / пунктуация также довольно хорош, но для материалов на норвежском языке (что наиболее актуально для нас) вряд ли есть какое-либо форматирование / пунктуация вообще. Мы используем C# API SpeechRecognizer, где config.SpeechRecognitionLanguage имеет значение "nb-NO", config.OutputFormat имеет значение OutputFormat.Detailed и используется config.RequestWordLevelTimestamps (). Есть ли что-то, что мы можем сделать для улучшения форматирования результатов?
Кроме того, при извлечении отдельных слов с метками времени (что является одним из наших требований) нет форматирования даже с материалами Engli sh. Есть ли какая-нибудь опция, которую мы можем установить для сохранения форматирования / пунктуации при извлечении отдельных слов?
С наилучшими пожеланиями, Гуннар