Кто-нибудь может предоставить ссылки, советы или другие виды помощи по следующим вопросам?
Цель - использовать python для классификации 10-секундных аудиосэмплов, чтобы потом я мог говорить в микрофон, чтобы Python выбирал и воспроизводил фрагменты (затемненные вместе) ближайших совпадений из дБ.Моя цель не состоит в том, чтобы иметь самое близкое соответствие, и мне все равно, каков источник аудиосэмплов.Таким образом, результат, вероятно, бесполезен, кроме как говорить в шуме (забавно).
Я бы хотел, чтобы приложение python могло найти конкретное совпадение FFT, например, в пределах 10-секундных выборок в БД.Я предполагаю, что в реальном времени сэмплирование с микрофона будет иметь буферную выборку в 100 миллисекунд.
Есть идеи?FFT?Что дБ?Другое