Question

Я хочу внедрить систему, которая получает речь через микрофон на моем Mac OS x. Я знаю, что произвольное распознавание речи практически невозможно без обучения системы, поэтому я хочу ограничить его 10 простыми предложениями. Он должен с высокой степенью точности распознавать, какие из этих 10 предложений произносятся, генерировать текст и добавлять запись в удаленную базу данных MySQL.

Учитывая то, что это архитектура системы, которую я хочу реализовать, кто-нибудь может дать мне представление о том, как лучше всего внедрить эту систему? Я ищу идеи, такие как библиотеки с открытым исходным кодом, чтобы минимизировать кодирование, так как это всего лишь прототип приложения для демонстрации. В основном я ищу быстрое и простое решение. Спасибо!

Eric Brown · Answer 1 · 03 июня 2010

Я думаю, что Сфинкс , вероятно, ваш единственный вариант.

Sai Sunder · Answer 2 · 26 февраля 2014

Sphinx - это хороший API для распознавания речи, который соответствует вашим целям. Вы можете получить простое руководство по использованию sphinx в http://preciselyconcise.com/apis_and_installations/sphinx.php

Самый быстрый и простой способ реализовать преобразование речи в текст для небольшого подмножества речи

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Самый быстрый и простой способ реализовать преобразование речи в текст для небольшого подмножества речи

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы