У меня есть два mp3-файла. Первый содержит аудио человека, читающего какой-то текстовый абзац. Второй файл содержит аудио одного и того же человека, читая всего несколько слов. Я хочу программно определить, появляется ли звук в более коротком файле в какой-то момент в более длинном файле.
Здесь возможно преобразование речи в текст, но позже я хочу перейти к обычным аудиофайлам, поэтому я нужно более общее решение.