Я работаю над прототипом, в котором я пытаюсь найти и сопоставить шаблоны между двумя аудиофайлами. В качестве наивного примера предположим, что у нас есть два аудиофайла по 5 секунд, в которых есть следующие мои записи: 1. «Я люблю собак». 2. «Собаки потрясающие!»
Здесь я хочу проанализировать и распознать определенные особенности, чтобы сделать вывод, что общим словом между двумя аудиофайлами является слово «Собака». Обратите внимание, что содержание НЕ важно. В противном случае я мог бы преобразовать его в текст и сопоставить его. Я хочу проанализировать общие закономерности. У меня базовое c понимание звуковых функций, таких как mf cc, хроматограммы и т. Д. c. но что и как использовать в этом контексте?