На самом деле есть способ сделать это с помощью JavaScript, и это делается с помощью Web Speech API.Это позволяет быстро выполнять распознавание голоса, а также синтез речи.
Простейший пример синтеза речи:
var utterance = new SpeechSynthesisUtterance('Hello World');
window.speechSynthesis.speak(utterance);
Простейший пример распознавания голоса:
var recognition = new webkitSpeechRecognition();
recognition.onresult = function(event) {
console.log(event);
}
recognition.start();