Надеюсь, вы работаете в python ...
import speech_recognition as sr
# to record audio
r = sr.Recognizer()
mic = sr.Microphone()
# to record audio
with mic as source:
audio = r.listen(source)
# to play audio
try:
text = r.recognize_google(audio)
print "you said: " + text
except sr.UnknownValueError:
print("Google Speech Recognition could not understand audio")
Есть много параметров, которые вы можете изменить и улучшить свой распознаватель речи. Если вы хотите узнать больше, проверьте это
Вот код для Js ...
var recognition = new webkitSpeechRecognition();
recognition.continuous = true;
var output = document.getElementById('output');
recognition.onresult = function(event) {
output.textContent = event.results[0][0].transcript;
};