Использование Cortana для диктовки документов - PullRequest
0 голосов
/ 17 мая 2018

В настоящее время я занимаюсь исследованием Кортаны, так как я заинтересован в разработке некоторых пользовательских навыков для нее. В настоящее время я использую Cortana для вызова распознавания речи в Windows, где я могу использовать WSR в качестве средства диктовки текста в Word. Я экспериментирую с этим, чтобы использовать его для записи и создания стенограммы в режиме реального времени для совещаний.

Теперь, как я обнаружил, это довольно хлопотно, и мне любопытно узнать, могу ли я что-то сделать, чтобы интегрировать бота в Cortana для той же цели. Я посмотрел и немного прочитал об Azure Bot Framework, Cognitive Services, LUIS и т. Д.

Можно ли разработать такое решение с использованием вышеперечисленных услуг?

Заранее спасибо!

1 Ответ

0 голосов
/ 21 мая 2018

Да, это возможно.

Вы можете подавать потоки в Speech to Text API , затем распределять аудио по частям в соответствии с Offset и Duration каждой фразы, а затем отправлять эти фрагменты в Speaker API распознавания , позволяющий идентифицировать говорящего по имени, чтобы у вас было имя для каждого чанка, в который была добавлена ​​его транскрибированная фраза, и для создания диалога из

Поскольку вы рассматриваете его в основном для собраний, упомянутое вами решение было анонсировано некоторое время назад как функция Microsoft Teams, и оно будет доступно для общественности в ближайшем будущем, вы также можете посмотреть демонстрацию который был представлен на Build 2018 от здесь

...