Я присутствовал на сессии, на которой Дидье Браун продемонстрировал Голосовой Жест. Основная идея заключается в том, что вы превращаете проблему распознавания голоса в проблему распознавания изображений. Демонстрация здесь: http://vimeo.com/8203323
Из flash 10.1 вы можете иметь низкоуровневый доступ к данным микрофона, что позволяет разработчику создавать аудиограмму.
Хотя существует много серверных решений этой проблемы, к сожалению, не так много на стороне клиента.