Есть ли способ использовать необработанные аудиоданные с использованием таких технологий, как Alexa или DialogFlow.ai? - PullRequest
2 голосов
/ 08 октября 2019

Я разрабатываю приложение, которое использует распознавание голоса , чтобы помочь слепым людям изучать музыку. Для этого я подумываю использовать что-то как DialogFlow.ai или даже Amazon Alexa , чтобы не вернуть колесо. Таким образом, бывают случаи, когда я хочу использовать необработанные аудиоданные, чтобы проверить, настроены ли инструменты. С помощью этих технологий по умолчанию весь аудиовход интерпретируется и, следовательно, преобразуется в текст. Итак, есть ли способ использовать необработанные аудиоданные вместо интерпретации речи пользователя?

Ответы [ 2 ]

4 голосов
/ 09 октября 2019

По ряду причин (в основном из-за безопасности) Amazon Alexa и другие подобные технологии не позволят вам получить необработанный вклад пользователя. Использование Amazon Alexa как способа захвата аудиовхода инструмента не является правдоподобным способом реализации тюнера. Вы должны реализовать свой собственный способ захвата аудио и, возможно, использовать его в сочетании с Alexa / DialogFlow для интерпретации команд.

1 голос
/ 08 октября 2019

Не похоже, что использование распознавания речи для настройки инструментов - отличная идея, это совсем другие вещи. Вероятно, лучше использовать существующую библиотеку, например http://gillesdegottex.github.io/fmit/ss.html

...