Расшифровка неполного аудиофайла - PullRequest
0 голосов
/ 16 февраля 2019

Мне дали несжатый аудио-файл .wav (360 МБ), который, кажется, поврежден.Файл был записан с помощью небольшого USB-рекордера (сейчас у меня нет больше информации о рекордере).Он не читался любым плеером, и я попробовал GSpot (https://www.headbands.com/gspot/), чтобы определить, возможно, он был другого формата, чем wav, но безрезультатно. Файл большой, что указывает на то, что он находится в каком-то несжатом форматеОн пропускает символы RIFF-WAVE в начале файла, хотя это может указывать на то, что это какой-то другой формат или, возможно, (более вероятно, в этом случае) заголовок отсутствует.

Я пробовалпреобразование байтов файла непосредственно в аудио, и это создает ОЧЕНЬ шумный аудиофайл, хотя голоса можно было разобрать, и я смог определить, что частота дискретизации была, вероятно, 22050 Гц (учитывая размер выборки 8 бит) и длину файлаоколо 4 часов и 45 минут. Выполнение через некоторые фильтры в Audition привело к созданию файла, который был понятен в некоторых местах, но все еще был слишком шумным в других.

Затем я попытался пропустить данные через некоторый код Java.это производит изображение из байтов, и это показало мне много шума, но также и 3 байта разделениякаждые 1024 байта.Сначала байт, близкий к 0 или 255 (но не 100%), затем байт, представляющий число, распределенное где-то около 25 (но с некоторым изменением), а затем 00000000 (всегда, 100%).Первый «заголовок куска» (как я полагаю, таковой) расположен в файле на 513 байтов, снова близко к 2-степенному значению, как размер куска.Кажется слишком идеальным для совпадения, поэтому я упоминаю об этом, поскольку это может быть важно.https://imgur.com/a/sgZ0JFS, первое изображение показывает изображение 1024x1024, показывающее первые 1 МБ файла (по строкам), а второе изображение показывает распределение 3 байтов «заголовка куска».

Рядом с этимиЗаголовки, файл также имеет области, которые четко показывают структуру, почти волнообразные структуры.Я предполагаю, что это фактический звук, который я ищу, но он пронизан шумом: https://imgur.com/a/sgZ0JFS, третье изображение, показывающее область файла со звуковыми структурами.

Я также создал гистограмму длявесь файл (без учета 3-байтовых «заголовков чанков»): https://imgur.com/a/sgZ0JFS, четвертое изображение.Я перевернул нижнюю половину диапазона, так как считаю, что аудиоданные должны быть сосредоточены вокруг некоторого среднего значения, но поправьте меня, если я ошибаюсь.Возможно, несимметричная природа гистограммы как-то связана с данными со знаком / без знака или с дополнением до двух.Возможно, представление данных в 8-битных числах с плавающей точкой или что-то подобное, я не знаю.

Я столкнулся со стеной.Я понятия не имею, что еще я могу попробовать.Есть ли кто-нибудь там, кто видит то, что я пропустил.Возможно, кто-то может дать мне несколько советов, что еще попробовать.Я действительно хотел бы извлечь аудиоданные из этого файла, поскольку он содержит некоторую важную информацию.

1 Ответ

0 голосов
/ 16 февраля 2019

Простите за беспокойство.Я смог отследить владельца диктофона и заставить его записать мне минуту аудио и отправить мне этот файл.Я смог определить, был ли звук IMA 4-битным ADPCM в кодировке, 16-битный звук с частотой 48000 Гц.Глядя на структуру файла, я понял, что простое размещение заголовка хорошего файла перед данными о плохом файле должно быть возможным, и вот, я снова получил рабочий файл:)

I 'Меня все еще очень интересует, как работает этот ADPCM и могу ли я написать свой собственный декодер, но это еще один день, когда я снова прогуливаюсь по Википедии.Всем хорошего дня!

...