Это может быть широкий ответ, но я хотел бы увидеть ответы и обсудить эту тему с пользователями SO.
Пока что я предполагаю, что аудиофайл (WAV) имеет частоту дискретизации, которая может быть 44000 или 48000(я видел большинство этих 2), и из этого мы можем определить, что одна секунда в файл (секунда 00:00:01) имеет ровно 44000 целочисленных значений, что означает, что здесь у нас есть Int[]
, так что если аудиоДлительность файла составляет 5 секунд, он имеет 5 * 44000 целых чисел (или 5 сэмплов).
Итак, мой вопрос, как мы можем вычислить разницу (или сходство) контента между двумя временными промежутками, такими как Audio1.wav иAudio2.wav в 00:00:01 с той же частотой дискретизации.