Привет, я хочу иметь api или sdk для распознавания речи, который распознает речь, произнесенную пользователем, и дает ее текстовую форму.
Подробное описание выглядит следующим образом:
В моем приложении Iнужно воспроизвести аудиофайл и текст которого уже есть у меня.Когда начинается воспроизведение звука, должно быть выделено слово, которое произнесено (из аудиофайла).
Так что, если я смогу получить слово от api или sdk, то можно выделить его.
Кроме того, я много гуглил для api и наткнулся на ceedvocalsdk но это не доступно для бесплатной пробной версии.
Если кто-то может предоставить любую идею, кроме этой, подходящую для моих требований или API или SDK, я буду очень благодарен.