Я пытаюсь определить, какой звук воспроизводится в микрофоне в режиме реального времени с помощью Unity3D.
У меня есть коллекция из дюжины клипов (с речью, музыкой, sfx в нем), и мне нужно обнаружить и определить, когда один из клипов воспроизводится в микрофоне (с плохим качеством, шумом и т. Д.).
Я нашел Speech.KeywordRecognizer и другие распознаватели, которые используют распознавание голоса для распознавания слов в режиме реального времени. Есть ли что-то похожее с использованием набора звуков вместо слов?