Как бы вы сравнили произнесенное слово с аудиофайлом? - PullRequest
2 голосов
/ 23 ноября 2010

Как бы вы сравнили произнесенное слово с аудиофайлом и определили, соответствуют ли они?Например, если я скажу «яблоко» своему приложению для iPhone, я бы хотел, чтобы оно записало звук и сравнило его с предварительно записанным аудиофайлом того, кто говорит «яблоко».Он должен быть в состоянии определить, совпадают ли два произнесенных слова.

Какой алгоритм или библиотеку я могу использовать для такого сопоставления аудиофайлов на основе голоса?

Ответы [ 4 ]

1 голос
/ 09 декабря 2013

Я знаю, что этот вопрос старый, но сегодня я обнаружил эту библиотеку:

http://www.ispikit.com/

1 голос
/ 23 ноября 2010

Вы должны посмотреть Acoustic Fingerprinting, см. Ссылку в Википедии ниже.Shazam в основном занимается музыкой.

http://en.wikipedia.org/wiki/Acoustic_fingerprint

0 голосов
/ 24 ноября 2010

Sphinx выполняет распознавание голоса, а pocketSphinx был портирован на iPhone Брайаном Кингом

чек https://github.com/KingOfBrian/VocalKit

Он предоставил отличные детали и упростил реализацию для себя. Я запустил его пример и изменил его собственное исполнение.

0 голосов
/ 23 ноября 2010

Вы можете использовать библиотеку нейронных сетей и научить ее распознавать различные образцы речи. Это потребует некоторых знаний, которые лежат в основе общей теории нейронных сетей и как их можно использовать для создания систем, которые будут вести себя определенным образом. Если вы ничего не знаете о предмете, вы можете начать только с основ, а затем использовать библиотеку, а не реализовывать что-то самостоятельно. Надеюсь, это поможет.

...