Моя цель состоит в том, чтобы иметь возможность обнаруживать определенный шум, который идет через динамики ПК с использованием Python. Это означает следующее в псевдокоде:
- Звук воспроизводится из динамиков, в таких приложениях, как игры, например
- Звучит мой звук для обнаружения звука, иЯ хочу обнаружить это и предпринять действие
Конкретный звук, который я хочу обнаружить для примера , можно найти здесь .
Если я разобью егоМне кажется, мне нужны две вещи:
- Способ сэмплирования звука, который передается на аудиоустройство - Возможно, что-то основано на этом? или потенциально звуковое устройство - ноЯ не могу определить, как сделать эту работу, посмотрев их API ?
- Способ сравнения каждого семпла с моим звуковым файлом "аудио для обнаружения".
Обнаружение не должно быть точным - оно просто должно быть близко. Например, будет много других шумов, происходящих в одно и то же время, поэтому больше возможностей обнаруживать след «аудио для обнаружения» в аудиопотоке множества звуков.
Исследовав этоЯ нашел технологии, упомянутые в этом посте на SO , а также в этой интересной статье о Chromaprint . Статья Chromaprint использует fpcalc для генерации отпечатков пальцев, но, поскольку мой «звук для обнаружения» составляет около 1-2 секунд, fpcalc не может генерировать отпечаток. Мне нужно что-то, что работает в меньших временных пространствах.
Мой вопрос - может ли кто-нибудь помочь мне с двумя частями моего вопроса:
- Как мне сэмплировать аудиоустройство на моем ПК? использование python
- Как мне попробовать это сравнение (в идеале с небольшим примером)
Большое спасибо заранее.