Обнаружение шума в аудиопотоке в Python - PullRequest
1 голос
/ 09 ноября 2019

Моя цель состоит в том, чтобы иметь возможность обнаруживать определенный шум, который идет через динамики ПК с использованием Python. Это означает следующее в псевдокоде:

  1. Звук воспроизводится из динамиков, в таких приложениях, как игры, например
  2. Звучит мой звук для обнаружения звука, иЯ хочу обнаружить это и предпринять действие

Конкретный звук, который я хочу обнаружить для примера , можно найти здесь .

Если я разобью егоМне кажется, мне нужны две вещи:

  1. Способ сэмплирования звука, который передается на аудиоустройство - Возможно, что-то основано на этом? или потенциально звуковое устройство - ноЯ не могу определить, как сделать эту работу, посмотрев их API ?
  2. Способ сравнения каждого семпла с моим звуковым файлом "аудио для обнаружения".

Обнаружение не должно быть точным - оно просто должно быть близко. Например, будет много других шумов, происходящих в одно и то же время, поэтому больше возможностей обнаруживать след «аудио для обнаружения» в аудиопотоке множества звуков.

Исследовав этоЯ нашел технологии, упомянутые в этом посте на SO , а также в этой интересной статье о Chromaprint . Статья Chromaprint использует fpcalc для генерации отпечатков пальцев, но, поскольку мой «звук для обнаружения» составляет около 1-2 секунд, fpcalc не может генерировать отпечаток. Мне нужно что-то, что работает в меньших временных пространствах.

Мой вопрос - может ли кто-нибудь помочь мне с двумя частями моего вопроса:

  1. Как мне сэмплировать аудиоустройство на моем ПК? использование python
  2. Как мне попробовать это сравнение (в идеале с небольшим примером)

Большое спасибо заранее.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...