У меня есть некоторая ауд ios из 1 секунды, произнесенная разными ораторами, в которой каждый звук звучит по одному слову. Это то же самое, что набор данных команды google voice, за исключением того, что я не знаю докладчиков. Имя файла не сохраняется в соответствии с динамиками.
Можно ли как-то классифицировать этих динамиков? Или пометьте те же динамики.
Заранее спасибо.