Мне нужно прослушать сжатый аудиопоток с низкой скоростью передачи, поступающий с телефона (искаженный во всех аспектах, когда звук через POTS искажается в настоящее время) и определить в реальном времени, соответствует ли то, что я слышу, предварительно записанный аудиоклип.
Аудиоклип будет иметь автоответчик, сообщающий, что служба недоступна (в этот момент мой сценарий прервет соединение и попытается позже).
Мне не нужно сопоставлять гигантскую базу данных звуков, только один предварительно записанный клип (возможно, записанный несколько раз для лучшего обнаружения?); Единственное предостережение в том, что клип для сравнения будет (конечно) записываться также с телефона, поэтому сравнение должно учитывать низкий битрейт и низкое качество кодирования
Я скажу, что мне нужно в идеале принять решение «да, это одно и то же» в течение 3-5 секунд, поэтому мне не нужно «супер-реальное время»
Я должен иметь возможность генерировать большое количество клипов для проверки, чтобы убедиться, что все работает правильно, но я хотел бы усовершенствовать систему, для которой требуется всего один или два клипа. хорошая работа, так как запись многих клипов для сравнения займет непрактичное время
Для справки, на данный момент языки / среды, с которыми я больше всего знаком, это PHP (который я чаще всего использую в CLI), оболочка и очень небольшое количество C.
Предложения по использованию других сред приветствуются, но если процесс объединения требует специальных знаний в области языка программирования или обработки звука (например, в общих чертах объясняется, как можно соединить 8 случайных библиотек Python вместе), я могу придется пройти, иначе результат может сильно напоминать , что однажды вы решили, что кусок стейка на вилке не слишком большой ... Я действительно надеюсь, что есть куча фреймворков, которые почти сделайте это и не слишком сложно соединить. :)