Я новичок в ML и пытаюсь определить пол и возрастную группу говорящего на основе набора данных аудиофайлов. Я пытаюсь использовать для этого librosa .
Могу выполнить этот код и теперь не знаю, как действовать дальше. Любая помощь будет принята с благодарностью.
for file in range(0,len(audio_files),1):
audio, sfreq = lr.load(audio_files[file])
time = np.arange(0,len(audio)) / sfreq
fig, ax = plt.subplots()
ax.plot(time,audio)
ax.set(xlabel='time(s)', ylabel='Sound Amplitude')
plt.show()