идентификация / распознавание голоса человека - PullRequest
3 голосов
/ 05 марта 2012

Я хочу записать чей-то голос, а затем по информации, которую я получаю о его / ее голосе, узнаю, если этот человек заговорит снова! Проблема в том, что у меня нет информации о том, какие характеристики (например, частота) вызывают разницу с человеческим голосом, если кто-нибудь может помочь мне с тем, как я могу узнать чей-то голос?

пока я занимался исследованиями, я обнаружил различные библиотеки по распознаванию речи, но они не могли мне помочь, потому что моя проблема очень проста! я просто хочу узнать человека, который говорит не то, что говорит.

Ответы [ 3 ]

3 голосов
/ 05 марта 2012

Проблема, которую вы описываете, непроста, поскольку голос одного и того же человека может звучать по-разному (например, если у человека простуда и т. Д.) И / или если человек говорит громче / быстрее / медленнее и т. Д.

Другим моментом является отделение от других звуков (фон, другие голоса и т. Д.).

Очень важно качество оборудования для записи звука - некоторые системы используют несколько микрофонов для достижения хороших результатов ...

В целом это нелегкая задача - особенно. если вы хотите добиться хорошего коэффициента обнаружения.

В основном способ реализовать это:

  • реализовать надежное разделение звука
  • Реализация надежного извлечения звука / шаблона голоса
  • создание БД с отпечатками пальцев голоса (ов), которые вы хотите распознать, на основе идеальной настройки звука
  • определить алгоритм для сравнения сохраненных отпечатков пальцев с извлеченным / нормализованным шаблоном звука / голоса (могут иметься некоторые пороговые значения для «вероятно, равных» и т. Д. ...)
  • уточняйте свои алгоритмы, пока не достигнете приемлемой частоты обнаружения (также учитывайте ложную положительную оценку!)

Хороший обзор см. http://www.scholarpedia.org/article/Speaker_recognition

3 голосов
/ 20 ноября 2012

См. VoiceID для Linux.Он использует Sphinx и другие библиотеки и довольно легко устанавливается.

2 голосов
/ 05 марта 2012

Некоторая помощь здесь, может быть: http://www.generation5.org/content/2004/noReco.asp На основе библиотеки FFT с открытым исходным кодом (http://www.exocortex.org/dsp/), с некоторыми предложениями о том, как выполнить проверку докладчика.

...