Я думаю создать приложение.
Ниже приводится описание:
1. Люди будут загружать ранее записанный разговор на сервер.
2. Приложение с сервера определит высоту, скорость, акцент, произношение и т. Д. Этого голоса и создаст личное портфолио.
3. Если вы позвоните на сервер, серверное приложение будет говорить с вами точным голосовым тоном этого человека (чей голосовой сервер обнаружен на шаге 2).
Пожалуйста, поделитесь ссылками, ресурсами, презентацией в формате PDF, что вы считаете полезным для этого проекта .....
В основном я застрял на ШАГЕ 2. У меня нет четкого представления о том, как разбить голос, проанализировать его и получить информацию о скорости, высоте звука и т. Д. Есть ли какой-либо существующий API, доступный для голосовой части?