Основная единица звука? - PullRequest
       15

Основная единица звука?

14 голосов
/ 23 апреля 2010

Если мы считаем компьютерную графику искусством синтеза изображений, где основной единицей является пиксель.

Что является основной единицей синтеза звука?

[Это относится к программированию, так как я хочу создать это с помощью компьютерной программы.]

Спасибо!

Ответы [ 11 ]

21 голосов
/ 23 апреля 2010

Базовая единица измерения - сэмпл

. В файле WAVE сэмпл представляет собой просто целое число, указывающее, куда следует перемещать головку динамика.* частота дискретизации определяет частоту подачи нового сэмпла на динамики (я не совсем уверен, как работает эта часть, но сначала она преобразуется в аналоговый сигнал).Сэмплы, как правило, располагаются в файле один за другим.

Когда вы строите все сэмплы, для которых по оси x указано время, а по оси y - sample_value, вы можете увидеть сигнал.* В волновом файле сэмплы могут (теоретически) иметь любой битовый размер от 0 до 65535, который остается постоянным по всему волновому файлу.Но обычно используется 16 или 24 бита.

7 голосов
/ 23 апреля 2010

Компьютерная графика также может иметь в качестве основных единиц векторные фигуры, а не только пиксели.Как правило, векторная графика генерируется с помощью компьютерных инструментов, в то время как захваченные данные имеют тенденцию появляться в виде сетки пикселей (соответствующих массиву датчиков в камере или другом устройстве захвата).Очевидно, что между этими классификациями существует значительное пересечение.

Аналогично, существуют сэмплированные (например, .WAV) и генеративные (например, .MIDI) формы компьютерного звука.В случае выборки наименьшей единицей является единица выборка .Точно так же, как массив пикселей по яркости, x- и y-измерения собираются вместе, чтобы сформировать изображение, массив выборок в измерениях громкости и времени объединяется, чтобы сформировать звук.В генеративном случае это будет что-то более похожее на один тон , отображаемый в конкретном голосе , точно так же как у векторной графики путей , нарисованных с конкретными текстурами.

2 голосов
/ 23 апреля 2010

Пиксель может иметь значение и быть закодирован в цифровом растровом изображении samples.Те же свойства применяются к звуку и цифровому аудио samples.

Пиксель - это физическое устройство, которое может отображать амплитуды только трех частот света (красный, зеленый, синий) за раз.Динамик - это физическое устройство, которое может воспроизводить амплитуды широкого диапазона частот (~ 40000) одновременно.Битовое разрешение семпла (количество битов, используемых для хранения значения семпла) в основном определяет, сколько цветов / тонов может быть воспроизведено - точность воспроизведения физического устройства воспроизведения.

Кроме того, поскольку образцы пикселей можно кодировать или сжимать, большинство образцов звуковых образцов также кодируются или сжимаются (или оба).

1 голос
/ 23 июля 2014

Я бы сказал, что основная единица звука синтез - это синусоида. Но ваше определение синтеза, возможно, отличается от того, что люди называют аудио синтезом. Звуковой синтез - это создание звука с использованием основных компонентов звука.

С помощью синусоидальных волн мы можем синтезировать звуки, используя множество методов, таких как субстративный синтез, аддитивный синтез или синтез FM.

Теория Фурье утверждает, что каждый звук является суммой синусоидальных волн различных фаз, частот и амплитуд.

Хорошо, как мы представляем синусоидальную волну на компьютере? хорошо, синусоидальная волна будет сгенерирована с использованием буфера (массива) «семплов», которые были сгенерированы функцией или считаны из таблицы. Та же самая техника применяется к любому звуку, захваченному на компьютере.

«Сэмпл» обычно представлен числом от -1 до 1, которое напрямую коррелирует с амплитудой звука в данный момент времени. Типичный звук, записанный на глубине 16 бит, будет иметь 65536 (2pow16) возможных значений амплитуды. Как правило, при записи сэмпл будет захватывать 44,1 кб / с звука. Это называется частотой дискретизации или просто частотой дискретизации.

При воспроизведении с вашего компьютера каждый семпл проходит через цифро-аналоговый преобразователь и генерирует вибрацию на динамике вашего компьютера, что, в свою очередь, заставляет ухо воспринимать записанный звук.

1 голос
/ 23 апреля 2010

Фундаментальной единицей обработки сигнала (для которой аудио является особым случаем) будет выборка.

Частота, с которой необходимо дискретизировать сигнал, зависит от максимальной частоты, присутствующей в сигнале.Теорема выборки гласит, что обычно достаточно сэмплировать с удвоенной частотой максимальной частоты, присутствующей в сигнале.
http://en.wikipedia.org/wiki/Sampling_theorem
Человеческое ухо чувствительно к звукам вплоть до примерно 20 кГц (верхняя частота уменьшается с возрастом).Вот почему музыка на CD сэмплируется с частотой 44 кГц.

Часто более полезно думать о музыке как о том, что она состоит из отдельных частот.
http://www.phys.unsw.edu.au/jw/sound.spectrum.html
Большая часть анализа и создания звука основана наэта идея.

Понятия, связанные с данным:
Психоакустика: восприятие звука человеком.Относится к современным методам сжатия звука, таким как mp3.
Ряд Фурье: Как сложные осциллограммы состоят из отдельных частот.

0 голосов
/ 23 апреля 2010

Если компьютерная графика представляет собой цветные точки в 2-мерном пространстве, представляющие 3-мерное пространство, то синтез звука представляет собой амплитудные значения, регулярно разделяемые во времени, представляющие музыкальные события.

Если вы хотите, чтобы ваш результат звучал как музыка (та музыка, которая нравится большинству людей), то вы либо собираетесь использовать некоторые стандартные методы синтеза, либо буквально тратите десятилетия своей жизни, изобретая их с нуля.

Основными методами являются аддитивный синтез, в котором отдельными элементами являются частоты, амплитуды и фазы синусоидальных колебаний; вычитающий синтез, где вы работаете с коэффициентами фильтра и сложным входным сигналом; синтез частотной модуляции, где вы работаете с глубинами модуляции и скоростями этапов модуляции; гранулярный синтез, в котором короткие (от сотых до десятых доли секунды) обернутые фрагменты записанного звука или искусственной формы волны объединяются в огромных количествах. Каждый из них на практике использует параметры, которые меняются в течение заметки, и часто вы будете смешивать элементы различных техник в более крупном инструменте.

Я рекомендую эту книгу , хотя в ней нет математики для многих понятий, она, по крайней мере, закладывает основу для используемых понятий и дает хороший обзор методов.

Вы бы не тратили время на сэмплирование за сэмплом, чтобы заниматься музыкой на практике, равно как и тратить свое время на прохождение пикселя за пикселем для рендеринга 3D (другими словами, да, переходите сэмплирование за сэмплом, если создаете инструмент для других людей). делать музыку, но это слишком низкий уровень, если вы заинтересованы в создании музыки).

0 голосов
/ 23 апреля 2010

Растровые изображения основаны на выборке амплитуды света в двумерном пространстве, где каждая выборка оцифровывается до заданной битовой глубины и часто преобразуется в логарифмическое представление с различной битовой глубиной. Образцы всегда положительные, так как вы не можете быть темнее, чем чистый черный. Каждый из этих образцов называется пикселем.

Запись звука чаще всего основана на выборке величины звукового давления в микрофоне, где выборки берутся через постоянные промежутки времени. Эти образцы могут быть положительными или отрицательными в отношении идеальной тишины. Чаще всего эти образцы не преобразуются в логарифм, даже если звук воспринимается логарифмически так же, как и свет. Не существует специального термина для обозначения этих образцов, как в случае пикселей .

Bels и Децибелы, упомянутые другими, полезны в контексте измерения пиковых или средних уровней звука. Они не используются для описания отдельных образцов звука.

Возможно, вам также будет полезно узнать, как форматы звуковых файлов сравниваются с форматами файлов изображений. WAVE - это несжатый формат, специфичный для Windows и аналогичный BMP. MP3 - это сжатие с потерями, аналогичное JPEG. FLAC - это сжатие без потерь, аналогичное 24-битному PNG.

0 голосов
/ 23 апреля 2010

частота и амплитуда волны - это то, что составляет звук. Это для тона. Музыка или, в этом отношении, большая часть шума представляет собой совокупность нескольких одновременных звуковых волн, наложенных друг на друга.

При этом синтез музыки является большой областью.

0 голосов
/ 23 апреля 2010

Звук может быть выражен в нескольких различных единицах, но наиболее распространенным в синтезированной / компьютерной музыке является децибел (дБ) , которые являются относительной логарифмической мерой амплитуды.В частности, они обычно относятся к максимальной амплитуде аудиосистемы.

При измерении звука в «реальной жизни» единицы измерения обычно A-взвешенные децибел или дБ (A).

Частота звука (т. Е. Его высота) - это его амплитуда во времени или, в цифровом мире, его амплитуда по сэмплам.Количество выборок на единицу реального времени называется частотой дискретизации;В обычных системах Hi-Fi частота дискретизации составляет 44 кГц (44 000 выборок в секунду), а программное обеспечение для синтеза / записи обычно поддерживает частоту до 96 кГц.

Все звуки в цифровой области могут быть представлены в виде сигнала с помощью Xось, представляющая время (или номер образца), и ось Y, представляющая амплитуду.

0 голосов
/ 23 апреля 2010

Вероятно, конверт. Тон / нота имеет форму, описываемую: спад атаки устойчивый релиз

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...