Услуги распознавания речи (веб)? - PullRequest
4 голосов
/ 15 апреля 2010

У меня есть буфер аудио, и я хотел бы выполнить распознавание / транскрипцию речи на нем. Я ограничил использование ЦП и ОЗУ локально, поэтому хочу выполнить распознавание на сервере.

Существуют ли какие-либо (веб) сервисы, которые позволяют мне это делать?

Мои поиски пока ни к чему не привели ...

Ответы [ 2 ]

2 голосов
/ 12 февраля 2011

Google только что ввел браузерный доступ к своему речевому механизму через HTML5.

http://slides.html5rocks.com/#speech-input

Чтобы эта страница работала, я запустил браузер Chromium в Ubuntu следующим образом:

$ chromium-browser --enable-speech-input

Я полагаю, что идея состоит в том, чтобы иметь возможность создавать приложения, использующие распознаватель речи Google, но у меня не было возможности глубоко изучить его.

Еще один интересный проект - WAMI из MIT: http://wami.csail.mit.edu

1 голос
/ 19 апреля 2010

Lumenvox предлагает такую ​​услугу, но кажется дорогой для ваших нужд.

...