Распознавание голоса - PullRequest
       44

Распознавание голоса

3 голосов
/ 05 июня 2011

Я хочу создать программное обеспечение Voice Recognition , но я не знаю, с чего начать, какие инструменты я должен изучить и использовать?это программное обеспечение.Любая помощь, пожалуйста, любые ссылки, любые идеи приветствуются.Я искал книги, но не нашел ...

Заранее спасибо

Ответы [ 4 ]

6 голосов
/ 05 июня 2011

Вы не упомянули язык программирования и платформу, поэтому я попытаюсь быть несколько всеобъемлющим здесь.

Для Windows очевидным местом для начала является собственный Speech SDK от Microsoft . Я сам использовал это в одном из своих приложений, и его относительно легко настроить и использовать. Программа, которую я писал, была написана на C ++, но вы легко могли использовать библиотеку на другом языке.

Для Linux на самом деле не так много решений, но вы можете взглянуть на этот список, чтобы получить представление о том, что там есть. Большинство из этих библиотек предлагают интерфейсы C и, следовательно, могут работать на других языках, таких как Python или Perl.

На компьютерах Mac (с которыми у меня нет опыта), по-видимому, имеются возможности распознавания речи, доступные через интерфейс NSSpeechRecognizer . Интерфейс, конечно, доступен на языке программирования Objective-C.

0 голосов
/ 27 апреля 2016

Вы можете использовать API-интерфейсы Microsoft Speaker Recognition: https://www.microsoft.com/cognitive-services/en-us/speaker-recognition-api

В этих API-интерфейсах абстрагированы все операции, необходимые для распознавания голоса. Вы можете выполнять как проверку, так и идентификацию динамика.

Вот их C # и Python SDK: https://github.com/Microsoft/ProjectOxford-ClientSDK/tree/master/SpeakerRecognition

0 голосов
/ 02 мая 2014

Будет существовать некоторая теория относительно биометрической проверки.

По сути, вы хотите убедиться, что определенная запись голоса принадлежит определенному человеку, и никому другому.Конечно, вы не можете рассчитывать на «прямое совпадение» - например, сравнивая запись человека, говорящего «привет», с новой записью человека, говорящего «привет», - ни голос, ни акустическая выборка не работают таким образом.

То, что вы хотите (ваша библиотека) сделать, это взять один или несколько образцов голоса у человека и извлечь различные переменные из этих образцов (например, «свойства» голоса) и быть уверенным, что можно измерить эти свойствав новой записи и будьте уверены, что новый голосовой образец принадлежит тому же человеку («голосовой генератор»), который хранится в системе.

Как вы понимаете, в этом направлении проводилось много исследований.area - страница википедии по биометрии должна быть хорошей отправной точкой.Чтобы применить биометрические / статистические методы к распознаванию голоса, посетите страницу в Википедии по распознаванию речи .По сути, есть два метода - определить голос, который говорит что-то особенное (например, данное число), или просто прослушать голос, говорящий, и попытаться извлечь характеристики голоса, гарантируя, что голос принадлежит определенному человеку.

Iтакже указал бы на различные модели того, как моделируется голосовой тракт , а также на различные способы моделирования и распознавания интонации для целей аутентификации , и сказал бы: не пытайтесь делатьсделайте это самостоятельно для серьезных целей, если у вас нет 100 000 долларов, чтобы сэкономить.

0 голосов
/ 17 сентября 2013

Включить речевой поиск для вашего сайта

Вам просто нужно добавить свойство "x-webkit-speech" в текстовое поле поиска

Отображается только в том случае, если ваш браузер поддерживает голосовую функцию.

Код здесь

<h1>Enable speech search for your website</h1>
<form method="get">
   <input type="text" name="search" size="30" value="<?=$_REQUEST['search']?>"  id="search" onspeechchange="$('#search').keyup()" onwebkitspeechchange="$('#search').keyup()" x-webkit-speech="" speech="" />
   <input type="submit" value="Search" />
</form>

<?php
if(isset($_REQUEST['search']) && $_REQUEST['search']<>"");
{
    echo "<h2>"."You are searching for:";
  echo "<i>".$_REQUEST['search']."</i></h2>";
}
?>
...