Я хочу внедрить систему, которая получает речь через микрофон на моем Mac OS x. Я знаю, что произвольное распознавание речи практически невозможно без обучения системы, поэтому я хочу ограничить его 10 простыми предложениями. Он должен с высокой степенью точности распознавать, какие из этих 10 предложений произносятся, генерировать текст и добавлять запись в удаленную базу данных MySQL.
Учитывая то, что это архитектура системы, которую я хочу реализовать, кто-нибудь может дать мне представление о том, как лучше всего внедрить эту систему? Я ищу идеи, такие как библиотеки с открытым исходным кодом, чтобы минимизировать кодирование, так как это всего лишь прототип приложения для демонстрации. В основном я ищу быстрое и простое решение. Спасибо!