Распознавание речи - очень нетривиальная задача.Если вы действительно хотите создать такую систему, вам понадобится много сэмплов от носителей языка.Однажды собранная среда, такая как DeepSpeech от Mozilla, может стать для вас хорошей отправной точкой.
У Mozilla также есть еще один проект под названием "Общий голос" , который позволяет вампожертвуйте образцы голоса, чтобы помочь создать лучшие системы распознавания голоса.Однако они действительно пытаются получить данные, как вы можете видеть здесь .Чем меньше сообщество носителей языка, тем сложнее будет создать хорошую систему.