Я работаю над прототипом для преобразования текста в речь 2 с использованием файла WAV в качестве входных данных. В настоящее время я экспериментирую с несколькими ASR, такими как Microsoft SAPi, Sphinx и т. Д. Передаваемый аудиофайл WAV состоит из нескольких искажений / шумов.с фона.Я попытался использовать Audacity, чтобы полностью удалить шум, и распознавание стало немного лучше.Часть удаления шума, я Cam в настоящее время делает это через предоставленный интерфейс.Мой фон был Java, я хотел реализовать ту же часть удаления шума с использованием Java.Я скачал исходный код Audacity, и мне было интересно, какой из них будет лучше.1) Просто попробуйте сделать jni-вызов для уже существующих методов C ++.2) Реализовать свой собственный механизм шумовых затворов, используя преобразование Фурье.однако в последнем подходе это было бы больше похоже на изобретение колеса.Есть ли стандартный API / алгоритм, уже реализованный в Java, который будет принимать входной файл WAV и выполнять удаление шума, либо путем реализации фильтра верхних / нижних частот или с помощью любой другой методологии.
Я пытался найти книгу«цифровой звук с Java», который, по-видимому, содержит алгоритмы DSP, однако он не был доступен.Любая помощь в подходе или apis доступны, будет действительно полезным.