Возможно, это немного поздно, но я все равно позвоню.
Средства распознавания речи в OS X (как на стороне углерода, так и на стороне какао) предназначены для распознавания команд речи, что означает, что они будут распознавать слова (или фразы, команды), которые были загружены в модель языка речевой системы. , Я сделал кое-что с небольшими словарями, и это работает довольно хорошо, но если вы хотите распознать произвольную речь, вещи могут стать более приятными.
Что еще нужно помнить, это то, что функциональность, которую предоставляют речевые API в OS X, не один к одному. Материал Carbon обеспечивает функциональность, которая не достигла NSSpeechRecognizer
(в документах есть упоминание об этом).
Я не знаю о Какао, но диспетчер распознавания речи углерода позволяет вам указать входы, отличные от микрофона, чтобы звуковой поток работал нормально.