Голосовое управление через Интернет - PullRequest
0 голосов
/ 19 июля 2009

Мне просто интересен этот сценарий. Предположим, вы создаете веб-приложение и хотите получать речевые команды и выполнять действия на основе результата преобразования текста в текст.

Есть ли какие-либо серьезные препятствия, которые могли бы сделать это убийственным приложением?

Ответы [ 2 ]

0 голосов
/ 19 июля 2009

Низкосэмплированный звук можно использовать для алгоритмов s2t. Мои проблемы:

  1. Получение аудио на сервер и его обработка (флэш или Java или что-то)
  2. Проведение опроса клиента на предмет требуемого действия
  3. Создание этого масштабируемого на бэкэнде
  4. Работа с широким спектром языков, диалектов, перегибов и акцентов, которые поддерживает Интернет
  5. Обеспечение того, что беспрепятственно и доступный резервный вариант доступен
  6. рассмотрение жалоб от юзабилити людей

Есть намного больше, я уверен, но кроме этого пойти на это.

Где бы мы были без людей, идущих "мы идем на луну" и затем делая это . Пойти на это ...

Если это еще не было сделано , если вы потерпите неудачу или преуспеете, вы, вероятно, узнаете что-то крутое.

0 голосов
/ 19 июля 2009

Первое, о чем я могу подумать, - это, вероятно, качество передаваемого звука, которое будет в значительной степени зависеть от полосы пропускания пользователя. Чем меньше полоса пропускания, тем меньше качество, тем менее способный алгоритм преобразования текста в текст может обнаружить, что именно говорится.

...