Нужны инструменты преобразования текста в речь и распознавания речи для Linux - PullRequest
11 голосов
/ 18 мая 2009

Я планирую написать программу для Linux, которая использует текст для речи и распознавания речи. Каковы лучшие инструменты / библиотеки для этого? Должен ли я использовать Windows вместо того, чтобы иметь возможность использовать лучшие инструменты? Инструменты должны легко вызываться из консоли или программы на Си.

Ответы [ 12 ]

6 голосов
/ 18 мая 2009

Для распознавания речи существуют различные сфинксы . Разные варианты имеют разные плюсы и минусы, здесь есть сравнение Сравнение версий Sphinx . Сфинкс 4 - это Ява, а остальные - С, я считаю.

5 голосов
/ 18 мая 2009

Это зависит от того, какую речь вы пытаетесь распознать.

Это статья 2005 года, в которой объясняются некоторые трудности при создании программы диктовки: http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html. Если вы хотите, механизм распознавания речи Julius кажется многообещающим, но вам нужно будет добавить свои собственные акустические и языковые модели. Вы можете использовать акустическую модель voxforge .

Если вы не пытаетесь написать программу диктовки, тогда у вас гораздо более простая задача. Командные программы имеют ограниченный словарный запас, например, «Если вы хотите продолжить на английском языке, скажите« английский »».

Мне удалось получить довольно хорошие результаты, используя pocketsphinx и gstreamer, чтобы сделать программой , которая автоматически редактирует большинство вхождений слова " twitter " из TWiT подкаст. Это не работало вообще, пока я не использовал свою собственную языковую модель, основанную на стенограммах подкаста; машинные транскрипции из распознавателя речи бесполезны / смешны, но они хорошо справляются с поиском ключевого слова.

4 голосов
/ 18 мая 2009

Для распознавания речи существует очень мало для Linux. Я знал только об одном, по-видимому, приличном варианте, который IBM выпустила несколько лет назад, но позже он больше не был доступен (кто-нибудь знает, можно ли получить этот ViaVoice SDK где-нибудь еще?). Более подробную информацию о возможных опциях можно найти в wikipedia .

4 голосов
/ 18 мая 2009

Я использовал оба Loquendo и Festival под Linux. Я бы посчитал фестивальные голоса, которые я использовал, довольно бедными, с очень роботизированным синтезом. Голоса Loquendo, с другой стороны, превосходны - очень высокого качества.

0 голосов
/ 13 августа 2014

Для преобразования текста в речь в Debian / Ubuntu также существует SVOX Pico:

sudo apt-get install libttspico-utils
0 голосов
/ 31 марта 2014

Проверяли ли вы синтез речи на основе HMM для преобразования текста в речь? Вы можете найти бесплатную демоверсию на сайте http://hts.sp.nitech.ac.jp/. Установка будет немного утомительной.

0 голосов
/ 24 марта 2011

Первоначальный вопрос был о поиске подходящих библиотек, я знаю, но с точки зрения использования распознавания речи, достаточно хорошего для реальной диктовки, похоже, что для Linux ничего не выйдет (хотя я уверен, что со временем это изменится, я подозреваю, это займет некоторое время, так как я не уверен, что многие люди заинтересованы).

В настоящее время я пытаюсь рекламировать Dragon NaturallySpeaking как поддерживаемый продукт CodeWeavers ... поэтому, если вы заинтересованы как пользователь, было бы полезно, если бы вы проголосовали ...

http://www.codeweavers.com/compatibility/browse/name/?app_id=8427

0 голосов
/ 04 января 2011

А потом есть мброла для преобразования текста в речь.

0 голосов
/ 04 января 2011

http://simon -listens.org / - программа распознавания речи и голоса с открытым исходным кодом

0 голосов
/ 12 июля 2010

Это немного устарело, но несколько дней назад я увидел достаточно подробное руководство по распознаванию речи на Hackaday: http://hackaday.com/2010/07/09/get-started-with-speech-recognition/

...