Самый простой звуковой формат? - PullRequest
10 голосов
/ 24 февраля 2009

Я читал о растровых изображениях. Они являются одним из наиболее простых форматов изображений (особенно 1-битных растровых изображений). Мне интересно посмотреть, как выглядит звуковой файл. Кто-нибудь может отослать меня к самому простому формату звукового файла?

спасибо

На самом деле, я нашел эту ссылку на wav-файл . Если у кого-то есть другие ссылки / мудрые слова, которые он хотел бы опубликовать, я был бы признателен.

Ответы [ 10 ]

8 голосов
/ 24 февраля 2009

8-битный моно несжатый WAV, на мой взгляд ...

Википедия

4 голосов
/ 24 февраля 2009

Волновые файлы - это самый простой звуковой формат. У них есть заголовок (который иногда может быть сложным, но обычно нет), и тогда фактические звуковые данные представляют собой необработанные, несжатые PCM. Однако, поскольку они не сжаты, они очень быстро разрастаются даже при умеренно длинных звуках.

1 голос
/ 03 марта 2014

Подобно подавлению однобитового изображения, вы можете представлять аудио одним битом, единственная проблема в том, что вы не сможете ничего услышать из него. Поскольку для того, чтобы слышать звуки, необходимо генерировать волну изменений давления от устройства (наушников / колонок), это не соответствует. Это в основном из-за того, что звук продолжает быть медиа, а графика - все еще медиа.

Вы можете представлять аудио с частотой менее 8 бит на семпл и меньшим количеством семплов в секунду. Где вы будете представлять его с более низким разрешением и потерять более высокие частоты соответственно. Например, если вы используете 8 бит для представления каждой выборки, ограничение SNR 50 дБ (сигнал / шум). Размещая 8000 выборок в секунду, можно представить полосу пропускания до 4 кГц (качество звука телефонии старого времени).

С другой стороны, если вы представляете каждый семпл с 16 битами и 44 100 семплами в секунду, мы получаем звук с качеством CD.
В необработанном виде число битов и выборок зависит от ожиданий пользователя, аналогично тому, как низкие разрешения изображения приемлемы для пользователя

Сжатие звука используется для уменьшения битов, используемых в сэмплах, а также количества сэмплов. Они основаны на методах сжатия, таких как ZIP-файлы, а также CELP (линейное предсказание с кодовым возбуждением) http://en.wikipedia.org/wiki/Code-excited_linear_prediction mp3, AMR-nb - это алгоритмы, которые используют там приемы

1 голос
/ 26 марта 2013

Как уже упоминалось, файлы WAV не самые простые и содержат заголовок.

1-битное ШИМ (широтно-импульсное) аудио может считаться самым простым в относительном выражении для 1-битного кодированного растрового изображения.

Принципал тот же, хотя и в двух измерениях для растрового изображения, в отличие от одного измерения для аудио.

Подробнее о широтно-импульсной модуляции в википедии

В подарочных картах со звуком и любой дешевой игрушке, воспроизводящей звук, используются методы ШИМ-кодирования звука, обычно с пьезоэлектрическим преобразователем (динамиком).

1 голос
/ 16 августа 2012

В случае сжатия ogg является наиболее сжатым форматом

В случае простоты я думаю, что файлы wav самые простые

1 голос
/ 24 февраля 2009

Заглянуть в libsndfile http://www.mega -nerd.com / libsndfile /

0 голосов
/ 02 января 2018

WAV файлы довольно просты. Они просто состоят из кратных 8, 16 или 32-битных целых чисел, которые указывают «высоту» (координату Y) волны в данный момент времени. Например, прямоугольная волна может выглядеть так в 8-битном WAV:

00 FF 00 FF 00

Это, конечно, значительно упрощено.

0 голосов
/ 27 апреля 2016

Проверьте формат аудио RAW.

Если это 8 бит, то его проще всего обрабатывать.

https://en.wikipedia.org/wiki/Raw_audio_format

0 голосов
/ 30 сентября 2013

Существует еще одно хорошее объяснение базового формата WAVE:
https://ccrma.stanford.edu/courses/422/projects/WaveFormat/
Я использовал его для реализации чтения / записи WAV на C # с нуля.
Постскриптум AudioFormat равно 1 для целочисленных значений и 3 для плавающей запятой.

0 голосов
/ 24 февраля 2009

WAV - это путь, хотя будьте осторожны - формат файла WAV может на самом деле хранить сжатые данные - хотя обычно это не так.

Я недавно использую Audacity для импорта необработанных звуковых данных из системы микроконтроллера. Он также может экспортировать необработанное аудио.

Таким образом, вы можете начать со звука практически в любом формате и экспортировать его в виде двоичного файла по своему желанию. Я использую, например, 16-битную подпись с прямым порядком байтов, моно. Очень удобно и очень легко манипулировать в простых тестовых программах. Возможно даже может десериализовать его на некоторых языках программирования в массив или вектор.

-Adam

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...