Я пытаюсь написать программу, которая принимает звук от пользователя через микрофон, а затем преобразует сказанное в текст для дальнейшей манипуляции.
Я знаю, что в Google есть такая вещь, но она предназначена для разработчиков Android, и я пытаюсь сделать что-то более похожее на расширение Chrome (расширение, которое я предусмотрел, - это расширение Chrome, но я открыт для альтернатив).
Я посмотрел на Mac OSX NSSpeechRecognizer, но мне нужно что-то более всестороннее, так как для этого необходимо заранее указать ограниченный грамматик.
Я не могу ожидать или предсказать, что мои пользователи скажут в микрофон (но я МОГУ предположить, что это будет английский).