Открытый источник для автоматического сопоставления речи? - PullRequest
2 голосов
/ 07 декабря 2011

Автоматическое сопоставление речи не является автоматическим распознаванием речи, которое заключается в сравнении двух фрагментов речевого аудиосигнала и возвращении процентного соотношения этих двух аудиосигналов.

Эта технология обычно используется в таких случаях:

  1. Произносить обучение, например, есть стандартный сигнал произношения слова «Hello», для студентов, которые изучают английский язык, они произносят свой собственный «Hello», поэтому нам нужно использовать технологию ASM, чтобы сравнить, какпохоже или насколько правильно произносится студент.Поэтому нам нужно выяснить алгоритм, чтобы сравнить эти два одномерных аудиосигнала.

2.Мы можем простираться сверху от одного слова до предложения.Тогда как сопоставить эти аудиосигналы?

Вопрос здесь в том, чтобы найти какое-нибудь хорошее открытое или коммерческое решение для ASM.

Или какие-нибудь другие хорошие решения для таких реальных требований?

Заранее спасибо!

1 Ответ

2 голосов
/ 08 декабря 2011

Сравнение с шаблоном не даст ничего хорошего, поскольку на самом деле оно не намекает на то, что было сказано неверно. Структура обучения хорошему произношению не соответствует шаблону, но акустической модели представляет правильное и неправильное произношение. Таким образом, он может обнаружить ошибки в речи, которые делают ученики. Вы можете прочитать

Система SRI EduSpeakTM: оценка распознавания и произношения http://www.speech.sri.com/people/hef/papers/EduSpeak.ps

Для реализации этого алгоритма на IPhone вы можете проверить

http://ottercall.com

...