API или SDK для речи в текст (распознавание речи) iphone - PullRequest
4 голосов
/ 11 ноября 2010

Привет, я хочу иметь api или sdk для распознавания речи, который распознает речь, произнесенную пользователем, и дает ее текстовую форму.

Подробное описание выглядит следующим образом:

В моем приложении Iнужно воспроизвести аудиофайл и текст которого уже есть у меня.Когда начинается воспроизведение звука, должно быть выделено слово, которое произнесено (из аудиофайла).

Так что, если я смогу получить слово от api или sdk, то можно выделить его.

Кроме того, я много гуглил для api и наткнулся на ceedvocalsdk но это не доступно для бесплатной пробной версии.

Если кто-то может предоставить любую идею, кроме этой, подходящую для моих требований или API или SDK, я буду очень благодарен.

Ответы [ 3 ]

7 голосов
/ 11 ноября 2010

Вы можете попробовать

http://www.politepix.com/openears/

Что касается скорости, она должна быть быстрой, вы, вероятно, используете ее неправильно.Как я понял, у вас уже есть текст, и вам нужно построить грамматику из этого текста.

2 голосов
/ 11 ноября 2010

Вы можете взглянуть на https://github.com/KingOfBrian/VocalKit,, но я сам не пробовал.

0 голосов
/ 12 ноября 2010

Вы также можете попробовать Nexiwave.com.

Я думаю, что функция, которую вы ищете, это то, что мы можем использовать TimeStamping: http://nexiwave.com/index.php/applications/for-transcription-companies

В основном это аудио и текст, затем мы ставим отметку времени в каждом предложении и слове.

Ben

...