Почему нейронная сеть не работает, когда вход записывается через микрофон? - PullRequest
0 голосов
/ 01 ноября 2019

Есть обученная нейронная сеть, которая обнаруживает плач ребенка. Он хорошо работает, когда исходное аудио вводится с помощью кода (архив, случай 1), но не, если на вход подается тот же звук через микрофон (случай 2).

Программа работает в Raspberry Pi (в Python). Он также не работает, если вы тренируете нейронную сеть с тем же звуком, который вы вставили в микрофон, но он работает хорошо, если вы пропускаете исходный аудиоархив через код. Что мы можем сделать для того, чтобы нейронная сеть распознала звук через микрофон?

case 1: Это хорошо работает, если мы возьмем оригинальное аудио (например, .wav), загруженное из Интернета, и введем его в программу.

вариант 2: не работает, если мы записываем один и тот же файл .wav с микрофоном: воспроизводим его в динамике, записываем его с микрофона на новый файл .wav, а затем вводим его в программу (пытаясьимитировать случай плачущего ребенка).

    default='/home/pi/Desktop/deteccion/baby_cry_detection/output/prediction
    '.format(os.path.dirname(os.path.abspath(_file_))))
    parser.add_argument('--file_name', default='filtered2.wav')
    parser.add_argument('--log_path',

Таким способом мы даем программе плачущее аудио, если 1 .wav загружается из Интернета, а 2 .wav загружается из Интернета,воспроизводится через громкоговоритель, записывается с помощью микрофона и применяется полосовой фильтр, а затем, наконец, вводится как показано ниже.

...