Есть ли кто-нибудь, кто имеет опыт работы с любым открытым исходным кодом или относительно дешевым API распознавания голоса для Java? Я в значительной степени ищу что-то, что превратит произнесенные слова в текст.
Со страницы распознавания речи Java на солнце кажется, что это что-то довольно мертвое. Мои требования - это то, что по крайней мере работает на Linux.
Кто-нибудь может порекомендовать что-нибудь? Чистая Java была бы бонусом, иначе можно было бы рассмотреть решение на основе Linux. И поскольку это домашний проект ... чем дешевле, тем лучше.
CMU Sphinx
Как отметил Амит, CMU Sphinx http://cmusphinx.sourceforge.net/html/cmusphinx.php
Моя проблема - массовая ошибка в словах. Тренировки кажутся самим собой проектом, я надеюсь собрать силы, чтобы попробовать его в эти выходные.
IBM ViaVoice
В 2004 году появились новости о том, что с помощью Voice Voice становится открытым исходным кодом . Похоже, выпуск новостей был преждевременным, и этого никогда не было. В какой-то момент VIA Voice был выпущен для linux , но, похоже, они остановились. Все, что, похоже, осталось на сайте IBM, это ViaVoice встроенный .
IBM Websphere Voice
Я предполагаю, что именно поэтому ViaVoice (рабочий стол) кажется прекращенным. IBM создала это коммерческое решение, которое будет стоить больше, чем рука и нога. И только использование этого займет те, что вы оставили, по крайней мере, после моего опыта работы с Websphere и их IDE.
Nuance
Кажется, они все еще могут создавать продукты для Linux. Но я думаю, что они потерялись и последовали за IBM на рынок серверов. Я не уверен в этом, их сайт не настолько дружелюбен в поиске полезной информации.
Открытый разум / Свободная речь
Эти ребята постоянно меняют название своего проекта. Возможно, компания, которая хочет денег, продолжает угрожать им, но я не знаю. Проект выглядит немного мертвым.
Я мог бы попробовать тренировать Сфинкса в эти выходные, чтобы понять, хочет ли он дружить. В худшем случае я буду использовать речевое решение Microsoft. В прошлом это работало хорошо для меня, но это не очень хорошее решение для Linux. Я мог бы использовать его через Wine, но тогда у меня будет два отдельных сервера ... грязный и грязный.
О, и что кажется хорошим местом для посещения для голоса / речи SpeechTechMag . У них есть «Справочник по годам», в котором есть список компаний, так или иначе относящихся к голосу / речи.