Я новичок в машинном обучении. Я делаю базовую систему ASR для моего местного языка, может кто-нибудь, пожалуйста, подскажите мне, как я могу обрабатывать аудио и текстовые данные.
у меня есть семь предложений переменной длины, каждое предложение имеет несколько файлов WAV.
я использую keras и тензор потока бэкэнда.
Большое спасибо.