Обнаружение эмоций в речи - PullRequest
2 голосов
/ 06 октября 2011

Я хотел бы создать приложение, которое анализирует эмоциональное содержание речи с микрофона.

Это, хотя иногда и используется как дополнительная функция, не связано с распознаванием речи. Эмоциональный анализ основан на просодических особенностях голоса (изменение высоты тона, скорости и т. Д., Тембра).

Я знаю, что это можно сделать на настольном компьютере, но я не хочу, чтобы пользователи загружали свои записи (телефонные разговоры) на сервер, чтобы получить эмоциональную обратную связь.

Что мне нужно, так это API, который либо предоставляет весь анализ, либо API, который я могу использовать для извлечения этих функций (то есть средней скорости разговора).

Есть ли такая вещь там?

Заранее спасибо!

1 Ответ

5 голосов
/ 06 октября 2011

Проверьте этот пакет OpenEAR, он должен предоставить все на последнем современном уровне искусства

http://sourceforge.net/projects/openart/

Подробнее об этом можно прочитать здесь

http://www.mmk.ei.tum.de/publ/pdf/09/09eyb1.pdf

Мюнхенский набор инструментов openEAR - это полный пакет для автоматического распознавания эмоций речи.Его акроним расшифровывается как открытый Emotion и Affect Recognition Toolkit.Он основан на экстракторе функций openSMILE и, таким образом, способен распознавать эмоции в режиме реального времени.Включены предварительно обученные модели для различных стандартных корпусов, а также сценарии и инструменты для быстрого создания и оценки пользовательских наборов моделей.В настоящее время в качестве классификатора используются машины опорных векторов, использующие libSVM libray.Вскоре появятся также двунаправленные рекуррентные нейронные сети с кратковременной памятью, многозначные многозначные байесовские сети и ленивые ученики.

openEAR - это бесплатное программное обеспечение, лицензируемое по лицензии GPL.Первый выпуск (включая наборы моделей и предварительно скомпилированные openSMILE) скоро будет доступен на Sourceforge: openEAR.Тем временем, пожалуйста, обратитесь к проекту openSMILE, где мы предоставляем механизм извлечения функций.

...