Question

Я планирую написать программу для Linux, которая использует текст для речи и распознавания речи. Каковы лучшие инструменты / библиотеки для этого? Должен ли я использовать Windows вместо того, чтобы иметь возможность использовать лучшие инструменты? Инструменты должны легко вызываться из консоли или программы на Си.

Matt G · Answer 1 · 18 мая 2009

Для распознавания речи существуют различные сфинксы . Разные варианты имеют разные плюсы и минусы, здесь есть сравнение Сравнение версий Sphinx . Сфинкс 4 - это Ява, а остальные - С, я считаю.

joeforker · Answer 2 · 18 мая 2009

Это зависит от того, какую речь вы пытаетесь распознать.

Это статья 2005 года, в которой объясняются некоторые трудности при создании программы диктовки: http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html. Если вы хотите, механизм распознавания речи Julius кажется многообещающим, но вам нужно будет добавить свои собственные акустические и языковые модели. Вы можете использовать акустическую модель voxforge .

Если вы не пытаетесь написать программу диктовки, тогда у вас гораздо более простая задача. Командные программы имеют ограниченный словарный запас, например, «Если вы хотите продолжить на английском языке, скажите« английский »».

Мне удалось получить довольно хорошие результаты, используя pocketsphinx и gstreamer, чтобы сделать программой , которая автоматически редактирует большинство вхождений слова " twitter " из TWiT подкаст. Это не работало вообще, пока я не использовал свою собственную языковую модель, основанную на стенограммах подкаста; машинные транскрипции из распознавателя речи бесполезны / смешны, но они хорошо справляются с поиском ключевого слова.

hlovdal · Answer 3 · 18 мая 2009

Для распознавания речи существует очень мало для Linux. Я знал только об одном, по-видимому, приличном варианте, который IBM выпустила несколько лет назад, но позже он больше не был доступен (кто-нибудь знает, можно ли получить этот ViaVoice SDK где-нибудь еще?). Более подробную информацию о возможных опциях можно найти в wikipedia .

mysomic · Answer 4 · 18 мая 2009

Я использовал оба Loquendo и Festival под Linux. Я бы посчитал фестивальные голоса, которые я использовал, довольно бедными, с очень роботизированным синтезом. Голоса Loquendo, с другой стороны, превосходны - очень высокого качества.

Ikem Krueger · Answer 5 · 13 августа 2014

Для преобразования текста в речь в Debian / Ubuntu также существует SVOX Pico:

sudo apt-get install libttspico-utils

se7en · Answer 6 · 31 марта 2014

Проверяли ли вы синтез речи на основе HMM для преобразования текста в речь? Вы можете найти бесплатную демоверсию на сайте http://hts.sp.nitech.ac.jp/. Установка будет немного утомительной.

David · Answer 7 · 24 марта 2011

Первоначальный вопрос был о поиске подходящих библиотек, я знаю, но с точки зрения использования распознавания речи, достаточно хорошего для реальной диктовки, похоже, что для Linux ничего не выйдет (хотя я уверен, что со временем это изменится, я подозреваю, это займет некоторое время, так как я не уверен, что многие люди заинтересованы).

В настоящее время я пытаюсь рекламировать Dragon NaturallySpeaking как поддерживаемый продукт CodeWeavers ... поэтому, если вы заинтересованы как пользователь, было бы полезно, если бы вы проголосовали ...

http://www.codeweavers.com/compatibility/browse/name/?app_id=8427

user562374 · Answer 8 · 04 января 2011

А потом есть мброла для преобразования текста в речь.

Grzegorz Wierzowiecki · Answer 9 · 04 января 2011

http://simon -listens.org / - программа распознавания речи и голоса с открытым исходным кодом

Cory Walker · Answer 10 · 12 июля 2010

Это немного устарело, но несколько дней назад я увидел достаточно подробное руководство по распознаванию речи на Hackaday: http://hackaday.com/2010/07/09/get-started-with-speech-recognition/

Нужны инструменты преобразования текста в речь и распознавания речи для Linux

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 12 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нужны инструменты преобразования текста в речь и распознавания речи для Linux

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 12 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы