Question

Я планирую запустить приложение, которое преобразует речь в текст в Linux. Существуют ли какие-либо интерфейсы, чтобы я мог их расширить? или есть ли такое приложение в Linux? Любые входы на это?

РЕДАКТИРОВАТЬ: приложение, которое я планирую написать, должно иметь возможность преобразовывать каждое слово, которое мы говорим, в текст, а не только в Да / Нет.

Dave Ray · Answer 1 · 18 января 2009

Ну, это довольно сложная задача, и, не говоря уже о том, какую технологию вы хотите использовать, вот несколько ссылок:

Распознавание речи в Википедии
Java Speech API
Спецификация грамматики распознавания речи W3C
Sphinx - механизм распознавания с открытым исходным кодом, написанный на Java

Удачи. Более подробно мы можем дать лучшие ответы. Например, существует большая разница между распознаванием в стиле центра обработки вызовов "да / нет" и даже частичным пониманием естественного языка.

Robert Elwell · Answer 2 · 18 января 2009

Предложения Дейва - отличное начало. Сфинкс очень изящен.

Я просто хочу добавить, что вы должны быть максимально вероятностными. Как одноразовый лингвист и даже более ранний любитель фонологии, я могу с уверенностью сказать, что не увлекайтесь лингвистическими моделями. Давайте не будем забывать о том, что часто ошибочно приписывают «каждый раз, когда я увольняю лингвиста, моя точность повышается». На самом деле речь идет о модели и ее способностях учитывать шум и вариации, а не то, что может сказать специалист по гуманитарным наукам из Массачусетского технологического института.

Хорошая книга, которую можно взять в руки, была бы "Обработка речи и языка" Юрафски и Мартина. Он имеет несколько очень полезных приложений вычислительных моделей для решения этой задачи. Работа Харви Суссмана над линейными коррелятами на склонах F2 для различных гласных (начиная с сов сарая и направляясь к людям), кажется, было бы неплохо внедрить в модель на днях.

braindead · Answer 3 · 26 января 2009

Sphinx - ваш лучший выбор на Linux. Я пробовал Сфинкс II и Сфинкс III. Существует несколько доступных языков с открытым исходным кодом и акустических моделей, которые можно использовать с каждой из них. Совсем не производительность на уровне производства, но достаточно хорошая для прототипирования или демонстрации. Для производства вам необходимо разработать свой собственный язык и акустические модели.

Преобразование речи в текст в Linux

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Преобразование речи в текст в Linux

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов