Я на самом деле пытался обнаружить наличие / отсутствие шума / эха в телефонной записи телефонных звонков wav. Я начал с изучения этапов обработки распознавания речи и обнаружил, что аддитивный шум удаляется перед подачей сигнала на алгоритмы распознавания речи. Также у меня есть алгоритмы улучшения речи, которые будут улучшать качество речевого сигнала, устранять шум из искаженного речевого сигнала. но я не совсем понял, существует ли какой-либо алгоритм / библиотека, которая ответит на вопрос, есть ли в записанном речевом файле шум / эхо или нет.
Может кто-нибудь предложить способы решения этой проблемы.
1. Должно ли это быть решено в фазе цифровой обработки сигнала, когда вы применяете преобразования для получения частотной области.
2. Или я должен извлечь речевые функции, следуя процессу, как в ASR, а затем использовать некоторые ML, чтобы подойти к этой проблеме.
Я также натолкнулся на SNR, который даст вам представление о том, насколько плохое качество wav-файла. Но для получения этого значения необходим опорный шумовой сигнал
Пожалуйста, предложите мне это, пс: предоставленные мной дополнительные сведения могут не относиться к реальной проблеме, поэтому я хотел бы узнать стандартный способ сделать это