Question

Я разрабатываю приложение, которое использует распознавание голоса , чтобы помочь слепым людям изучать музыку. Для этого я подумываю использовать что-то как DialogFlow.ai или даже Amazon Alexa , чтобы не вернуть колесо. Таким образом, бывают случаи, когда я хочу использовать необработанные аудиоданные, чтобы проверить, настроены ли инструменты. С помощью этих технологий по умолчанию весь аудиовход интерпретируется и, следовательно, преобразуется в текст. Итак, есть ли способ использовать необработанные аудиоданные вместо интерпретации речи пользователя?

o-mauro · Answer 1 · 09 октября 2019

По ряду причин (в основном из-за безопасности) Amazon Alexa и другие подобные технологии не позволят вам получить необработанный вклад пользователя. Использование Amazon Alexa как способа захвата аудиовхода инструмента не является правдоподобным способом реализации тюнера. Вы должны реализовать свой собственный способ захвата аудио и, возможно, использовать его в сочетании с Alexa / DialogFlow для интерпретации команд.

Nikolay Shmyrev · Answer 2 · 08 октября 2019

Не похоже, что использование распознавания речи для настройки инструментов - отличная идея, это совсем другие вещи. Вероятно, лучше использовать существующую библиотеку, например http://gillesdegottex.github.io/fmit/ss.html

Есть ли способ использовать необработанные аудиоданные с использованием таких технологий, как Alexa или DialogFlow.ai?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Есть ли способ использовать необработанные аудиоданные с использованием таких технологий, как Alexa или DialogFlow.ai?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы