Как сравнить два образца голоса на iOS? - PullRequest
5 голосов
/ 05 апреля 2011

Прежде всего, я хотел бы сказать, что мой вопрос не относится к «классическому» определению распознавания голоса.

То, что мы пытаемся сделать, несколько иное, в смысле:

  1. Пользователь записывает свою команду
  2. Позже, когда пользователь произнесет предварительно записанную команду, произойдет определенное действие.

Например, язапишите голосовую команду для звонка моей маме, чтобы я щелкнул по ней и сказал «мама».Затем, когда я использую программу и скажу «Мама», она автоматически позвонит ей.

Как мне выполнить сравнение голосовой команды с сохраненным голосовым образцом?

РЕДАКТИРОВАТЬ:нет необходимости в каких-либо способностях преобразования текста в речь, только для сравнения звуковых сигналов.Очевидно, мы ищем какой-то готовый продукт или структуру.

Ответы [ 4 ]

5 голосов
/ 05 апреля 2011

Один из способов сделать это для распознавания музыки - это взять временную последовательность частотных спектров (STFT-БПФ с временным окном) для двух рассматриваемых звуков, отобразить положения частотных пиков по оси времени и взаимно коррелировать два 2D частотно-временных отображения пиков для совпадения. Это гораздо надежнее, чем просто взаимная корреляция двух звуковых выборок, так как пики меняются гораздо меньше, чем все спектральные «помехи» между спектральными пиками. Этот метод будет работать лучше, если частота двух звуков и их высота не сильно изменились.

В iOS 4.x вы можете использовать платформу Accelerate для БПФ, а также, возможно, 2D кросс-корреляции.

0 голосов
/ 05 апреля 2011

Я думаю, вам нужно выполнить некую кросс-корреляцию , чтобы определить, насколько похожи эти два сигнала.(Предполагая, что это будет тот же пользователь, который говорит о курсе).Я просто печатаю этот ответ, чтобы посмотреть, поможет ли он, но я бы подождал лучшего ответа от кого-то еще.Мои навыки обработки сигналов близки к нулю.

0 голосов
/ 05 апреля 2011

Я не уверен, что ваш вопрос о DSP или как это сделать на iPhone. Если это последнее, я бы начал с проекта «Говори здесь», который предлагает Apple. Таким образом, у вас уже есть интерфейс для записи голоса в файл. Это избавит вас от многих проблем.

0 голосов
/ 05 апреля 2011

Попробуйте использовать стороннюю библиотеку, например OpenEars для приложений iOS. Вы можете попросить пользователей записать голосовой образец и сохранить его как переведенный текст или просто позволить им ввести текст для распознавания.

...