Автоматическое сопоставление речи не является автоматическим распознаванием речи, которое заключается в сравнении двух фрагментов речевого аудиосигнала и возвращении процентного соотношения этих двух аудиосигналов.
Эта технология обычно используется в таких случаях:
- Произносить обучение, например, есть стандартный сигнал произношения слова «Hello», для студентов, которые изучают английский язык, они произносят свой собственный «Hello», поэтому нам нужно использовать технологию ASM, чтобы сравнить, какпохоже или насколько правильно произносится студент.Поэтому нам нужно выяснить алгоритм, чтобы сравнить эти два одномерных аудиосигнала.
2.Мы можем простираться сверху от одного слова до предложения.Тогда как сопоставить эти аудиосигналы?
Вопрос здесь в том, чтобы найти какое-нибудь хорошее открытое или коммерческое решение для ASM.
Или какие-нибудь другие хорошие решения для таких реальных требований?
Заранее спасибо!