Я думаю, что речь Google о текстовых сообщениях (автоматическая транскрипция голосовой почты в Google Voice, автоматическое создание надписей на YouTube и т. Д.) Впечатляет.
Я посмотрел, сделал ли Google его доступным через API, и, похоже, они этого не сделали (не то, чтобы я их винил!). Хотя облачный сервис, обеспечивающий функциональность речи в тексте, был бы довольно крут.
Есть ли какой-нибудь "хак", который я могу использовать, чтобы получить доступ речи к тексту. Моя архитектура в основном сводится к этому - короткий 15-20 секундный клип wav / mp3 / other в качестве входных данных, выходных данных в виде открытого текста.
Есть идеи людей?