Как сравнить разговорный звук с эталонной записью - изучение языка - PullRequest
2 голосов
/ 12 апреля 2011

Я ищу способ сравнить представленную пользователем аудиозапись с эталонной записью для сравнения, чтобы дать кому-то оценку или процент для изучения языка.

Я понимаю, что это очень ненаучный способ ведения дел, и это больше, чем трюк, чем что-либо.

Мои первые мысли - это какое-то аудио-дактилоскопирование или сравнение формы сигнала.

Есть идеи, где мне искать?

Ответы [ 2 ]

3 голосов
/ 12 апреля 2011

Это ни в коем случае не тривиальная проблема, которую нужно решить, хотя есть множество исследований по этой теме.В настоящее время наиболее успешными формами машинного обучения в области распознавания речи являются методы Скрытая модель Маркова .

Возможно, вы также захотите взглянуть на существующие реализации алгоритмов HMM.Одна из таких библиотек на ранних стадиях - ghmm .

Возможно, даже лучше и легче применимо к вашей проблеме - HTK .

2 голосов
/ 13 апреля 2011

В дополнение к хорошему ответу chomp, одним из важных ключевых слов, которое вам, вероятно, нужно найти, является Dynamic Time Warping (DTW). Это статья в Википедии: http://en.wikipedia.org/wiki/Dynamic_time_warping

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...