API преобразования текста в речь (генерация голоса) и преобразования речи в текст (распознавание голоса) - PullRequest
15 голосов
/ 14 июня 2011

Существует ли полный список известных API-интерфейсов для настольных компьютеров или браузеров?

Ответы [ 3 ]

31 голосов
/ 15 июня 2011

Я перефразирую и обновлю ответ от Распознавание речи на C или Java или PHP? .Это ни в коем случае не является исчерпывающим, но это может быть началом для вас


Наблюдая за этими вопросами в течение нескольких месяцев, я видел, что большинство вариантов для разработчиков ломаются так:

Люди из Windows - используйте функции System.Speech .Net или Microsoft.Speech и установите бесплатные распознаватели, предоставляемые Microsoft.Windows 7 включает полный речевой движок.Другие можно скачать бесплатно.Существует API C ++ для тех же механизмов, что и SAPI.См. http://msdn.microsoft.com/en-us/magazine/cc163663.aspx. или http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx. Дополнительные сведения о механизмах Microsoft для Windows В чем разница между System.Speech.Recognition и Microsoft.Speech.Recognition?

Люди из Linux - у Sphinx, похоже, хорошие последователи.См. http://cmusphinx.sourceforge.net/ и http://cmusphinx.sourceforge.net/wiki/

Коммерческие продукты - Nuance , Loquendo , AT & T , IBM другиеКаждый из них предоставляет свои собственные SDK и библиотеки для разных языков.

Онлайн сервис - Нюанс , Yapme , ispeech.org , vlingo , другие.Nuance улучшил свою программу для разработчиков и теперь предоставит вам бесплатный доступ к их сервисам для разработки.Яп (я полагаю) был недавно приобретен Amazon , поэтому мы можем увидеть некоторые изменения там.

Конечно, это также может быть полезно - http://en.wikipedia.org/wiki/List_of_speech_recognition_software

ЕстьAPI речи Java.См. Javax.speech.recognition в Java Speech API http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html. Я считаю, что вам все еще нужно найти речевой движок, который поддерживает этот API.Я не думаю, что Sphinx полностью его поддерживает - http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

Существует множество других SO вопросов: Нужны инструменты преобразования текста в речь и распознавания речи для Linux и pyspeech (python) - Транскрибировать mp3 файлы? , в которых говорится о http://code.google.com/p/pyspeech/. Вы также можете посмотреть на http://code.google.com/p/dragonfly/

2 голосов
/ 22 мая 2013

Ведущими поставщиками API преобразования текста в речь (генерация голоса) являются YAKiToMe! и iSpeech.YAKiToMe!это тот, который я использую, потому что мне нравится их качество голоса, и они наименее дорогие (в основном бесплатные).Они поддерживают мужчин и женщин, говорящих на нескольких языках.Некоторые поставщики голосовых услуг, такие как Acapella, Nuance, Loquendo и iVona, имеют приличные голоса, но, как правило, дороги в использовании.

1 голос
/ 08 января 2014

Вот как вы можете это сделать: Примечание: это API от Google, поэтому он работает только в браузере Chrome.

(См. Демонстрационную версию и загрузите полный исходный код здесь http://purpledesign.in/blog/?p=33)

, определите кнопку

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />

и определите, что вы хотите сделать в функции в своем JavaScriptfile

Like This

   function processspeech()
   {
     var speechtext=$("#speech").val();
     var elem = document.getElementById("test");
     elem.value = speechtext;
     var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+  speechtext + "</span>\" <br />*Is this what you said???";
    notify(notification);
}

Здесь

<textarea> id="test"></textarea>

Речь написана в текстовой области

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...