Подавление шума в файлах wav - PullRequest
3 голосов
/ 06 сентября 2011

Я работаю над прототипом для преобразования текста в речь 2 с использованием файла WAV в качестве входных данных. В настоящее время я экспериментирую с несколькими ASR, такими как Microsoft SAPi, Sphinx и т. Д. Передаваемый аудиофайл WAV состоит из нескольких искажений / шумов.с фона.Я попытался использовать Audacity, чтобы полностью удалить шум, и распознавание стало немного лучше.Часть удаления шума, я Cam в настоящее время делает это через предоставленный интерфейс.Мой фон был Java, я хотел реализовать ту же часть удаления шума с использованием Java.Я скачал исходный код Audacity, и мне было интересно, какой из них будет лучше.1) Просто попробуйте сделать jni-вызов для уже существующих методов C ++.2) Реализовать свой собственный механизм шумовых затворов, используя преобразование Фурье.однако в последнем подходе это было бы больше похоже на изобретение колеса.Есть ли стандартный API / алгоритм, уже реализованный в Java, который будет принимать входной файл WAV и выполнять удаление шума, либо путем реализации фильтра верхних / нижних частот или с помощью любой другой методологии.
Я пытался найти книгу«цифровой звук с Java», который, по-видимому, содержит алгоритмы DSP, однако он не был доступен.Любая помощь в подходе или apis доступны, будет действительно полезным.

1 Ответ

7 голосов
/ 06 сентября 2011

Вы можете попробовать:

  1. Используя шумовые затворы: http://en.wikipedia.org/wiki/Noise_gate

  2. Используйте позиционирование голоса -> голос в целом будет равен слеваи правильные каналы, если вы записываете это в стерео.И шум будет, как правило, сильнее в одном канале, чем в другом.

  3. Прочтите что-нибудь об устранении шума: http://www.developer.com/java/other/article.php/3599661/Adaptive-Noise-Cancellation-using-Java.htm

  4. Используйте низкий уровеньпроходной фильтр: Как реализовать фильтр нижних частот с использованием java

  5. Если вы можете справиться с условиями записи, расположите один микрофон позади динамика и уберите этот сигнал из голоса- микрофон.

...