Поскольку на данный момент у вас нет Speech API, доступного для приложений в стиле Metro, вы можете просто записать голос и отправить его в онлайн-службу, которая будет делать то, что вы хотите. Посмотрите Образец захвата медиа , если вы хотите пойти по этому пути.
Если вы хотите обрабатывать аудио локально, вы можете также использовать c ++ для обработки битов. Взгляните на Groove Drum Sequencer - HTML / JS и WinRT C ++ , где «Генерация звука осуществляется с помощью пользовательского компонента WinRT, реализованного на C ++ и использующего XAudio2 для воспроизведения звука, который вызывается из Javascript».