Question

Мне просто интересен этот сценарий. Предположим, вы создаете веб-приложение и хотите получать речевые команды и выполнять действия на основе результата преобразования текста в текст.

Есть ли какие-либо серьезные препятствия, которые могли бы сделать это убийственным приложением?

Aiden Bell · Answer 1 · 19 июля 2009

Низкосэмплированный звук можно использовать для алгоритмов s2t. Мои проблемы:

Получение аудио на сервер и его обработка (флэш или Java или что-то)
Проведение опроса клиента на предмет требуемого действия
Создание этого масштабируемого на бэкэнде
Работа с широким спектром языков, диалектов, перегибов и акцентов, которые поддерживает Интернет
Обеспечение того, что беспрепятственно и доступный резервный вариант доступен
рассмотрение жалоб от юзабилити людей

Есть намного больше, я уверен, но кроме этого пойти на это.

Где бы мы были без людей, идущих "мы идем на луну" и затем делая это . Пойти на это ...

Если это еще не было сделано , если вы потерпите неудачу или преуспеете, вы, вероятно, узнаете что-то крутое.

Adrian Godong · Answer 2 · 19 июля 2009

Первое, о чем я могу подумать, - это, вероятно, качество передаваемого звука, которое будет в значительной степени зависеть от полосы пропускания пользователя. Чем меньше полоса пропускания, тем меньше качество, тем менее способный алгоритм преобразования текста в текст может обнаружить, что именно говорится.

Голосовое управление через Интернет

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Голосовое управление через Интернет

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы