Я хотел бы создать приложение, которое анализирует эмоциональное содержание речи с микрофона.
Это, хотя иногда и используется как дополнительная функция, не связано с распознаванием речи. Эмоциональный анализ основан на просодических особенностях голоса (изменение высоты тона, скорости и т. Д., Тембра).
Я знаю, что это можно сделать на настольном компьютере, но я не хочу, чтобы пользователи загружали свои записи (телефонные разговоры) на сервер, чтобы получить эмоциональную обратную связь.
Что мне нужно, так это API, который либо предоставляет весь анализ, либо API, который я могу использовать для извлечения этих функций (то есть средней скорости разговора).
Есть ли такая вещь там?
Заранее спасибо!