Определение лучшего качества звука - PullRequest
11 голосов
/ 31 мая 2010

Как определить наилучшее качество звука в списке аудиофайлов одного и того же аудиоклипа, , не глядя на заголовок аудиофайла . Сложность в том, что все файлы были разных форматов и скоростей, и все они перекодировали в один и тот же формат и скорость. Как это можно сделать эффективно?

Ответы [ 9 ]

13 голосов
/ 17 июня 2010

Многие из приведенных здесь ответов относятся к распространенным измерениям звука, таким как THD + N, SNR и т. Д. Однако они не всегда хорошо коррелируют с человеческим слухом о звуковых артефактах. Методы сжатия аудио с потерями обычно работают на , увеличивая THD + N и SNR, но стремятся сделать это способами, которые трудно обнаружить человеческому уху. Более традиционный метод измерения звука может обнаружить снижение SNR в определенной полосе частот, но имеет ли это значение, если в соседних полосах так много энергии, что никто никогда не заметит разницу?

В исследовательской работе под названием « Воспринимаемая мера качества звука, основанная на психоакустическом звуковом представлении » описан алгоритм количественной оценки способности человеческого уха обнаруживать слышимые различия, основанный на модели того, как ухо слышит. Он принимает во внимание факторы, которые действительно связаны с качеством звука, воспринимаемым людьми. В документ включено исследование, сравнивающее результаты их алгоритма с субъективным двойным слепым тестированием, чтобы дать вам представление о том, насколько хорошо работает их модель.

Я не смог найти бесплатную копию этого документа, но приличная университетская библиотека должна иметь его в файле.

Реализация алгоритма потребует определенных знаний об обработке аудиосигнала в частотной области. Бакалавриат с опытом DSP должен быть в состоянии реализовать это. Если у вас нет эталонной формы волны, вы можете использовать информацию, приведенную в этом документе, для количественной оценки возможных нежелательных артефактов.

Алгоритм будет работать с аудио PCM, предпочтительно с синхронизацией по времени, и, конечно, не требует знания типа файла или заголовка.

9 голосов
/ 01 июня 2010

Я не разработчик программного обеспечения (я звукорежиссер), и то, что вы слышите при сжатии с помощью алгоритмов mp3: - менее высокие частоты: так что вы можете проверить потерю энергии более высокого диапазона - искаженное стерео: так что вы можете сделать среднюю / боковую матрицу и проверить наличие THD в боковой части. - меньшая фазовая когерентность: возможно, вы можете проверить это с помощью корреляционного измерителя

Надеюсь, это поможет, это сложная задача для компьютера!

8 голосов
/ 18 июня 2010

Во-первых, Я не звукорежиссер , но я пытался поддерживать связь со звуком в целом, потому что у меня большая коллекция mp3, и у меня есть некоторые мысли о том, предмет.

Наилучшее качество звука, которое вы ищете с человеческой точки зрения? Если это так, вы не можете измерить «объективными средствами», такими как сравнение спектрограмм и тому подобного.

Если спектрограмма уродливая, то не обязательно означает, что качество ужасное. Важно то, что кто-то может отличить закодированный файл от исходного источника, проводя слепое тестирование. Период. Если вы хотите проверить качество кодированной звуковой дорожки, вам нужно провести слепой тест ABX .

LAME (и все другие виды потерь MP3, AAC, AC3, DTS, ATRAC ... компрессоры) это так называемый перцептив кодировщик. Он использует определенные факты о природа человеческого аудио восприятия. Таким образом, вы не можете просто положиться на спектрограммы для оценки его качества.

Источник

Теперь, если ваши цели связаны с объективными манерами / перспективами, вы можете использовать EAQUAL , что означает оценку качества звука:

Это объективное измерение техника, используемая для измерения качества закодированных / декодированных аудиофайлов (очень похоже на ПИК)

(...)

Результаты, однако при использовании Методики объективного тестирования все еще неокончательно и в основном только используется разработчиками кодеков и исследователи.

... или Инструмент статистического анализа Фридмана .

(...) выполняет несколько статистических анализ наборов данных, который является особенно подходит для прослушивания теста данные.

Я не говорю, что анализаторы спектра бесполезны. Вот почему я разместил некоторые утилиты. Я просто говорю, чтобы быть осторожным со всеми этими статистическими методами: как кто-то из сообщества Hydrogenaudio однажды сказал , Вы не слушаете своими глазами. (проверьте эту тему, которую я разместил а это отличный ресурс). Чтобы действительно доказать качество звука с человеческой точки зрения, вы должны проверить уши, а не графики.

Это сложный вопрос, и, ИМХО, я предлагаю вам поискать специализированное аудио сообщество, такое как Hydrogenaudio .

4 голосов
/ 01 июня 2010

Если у вас есть оригинал, вы можете оценить, как он был изменен, оценив передаточную функцию. Вам нужно будет предположить какую-то модель, возможно, начать с фильтра нижних частот, добавить немного пятен (свертки), а затем запустить оценщик, чтобы получить показатель качества. Вы можете посмотреть в статье в Википедии Esposition_theory

4 голосов
/ 01 июня 2010

Если я правильно понимаю, у вас есть куча аудиофайлов, которые начинались в разных форматах с различным качеством. Все они были преобразованы в один и тот же формат, поэтому вы не можете использовать заголовок, чтобы выяснить, какие из них были изначально высокого качества, а какие - нет.

Это сложная проблема. Существует несколько хитростей, которые могут решить некоторые проблемы с качеством, но обнаружить, скажем, что-то, преобразованное из алгоритма сжатия с низким битрейтом, такого как MP3, будет очень сложно.

Несколько простых трюков:

  • Проверьте максимальную амплитуду - если она низкая, качество не будет хорошим.
  • Измерьте максимальную частоту - если она низкая, возможно, оригинал имел более низкую частоту дискретизации.
1 голос
/ 22 июня 2010

Новая мера качества восприятия для Аудио с пониженной скоростью передачи http://citeseer.ist.psu.edu/cache/papers/cs/15888/http:zSzzSzwww-ft.ee.tu-berlin.dezSzPublikationenzSzpaperszSzAES1996Copenhagen.pdf/a-new-perceptual-quality.pdf

Алгоритмы восприятия аудио кодирования выполнить радикальную нерелевантность снижение для достижения высокого усиление кодирования Компоненты сигнала, которые Предполагается, что не воспринимаются не передается и шум кодирования имеет спектральную форму в соответствии с порог маскирования аудиосигнала. Простые меры качества (например, сигнал отношение шумов, гармонические искажения), которые не могут отделить эти неразборчиво артефакты от слышимых ошибок, не могут использоваться для оценки эффективности такие кодеры.

Для оценки качества звуковые кодеки восприятия, соответствующие необходимы алгоритмы измерения, которые обнаруживают и оценивают слышимое артефакты, сравнивая выходные данные кодек с некодированной ссылкой. Модель восприятия на основе банка фильтров представлено, что дает лучше временное разрешение, чем на основе FFT подходы и, таким образом, позволяет более точное моделирование после маскировки и уточненный анализ конверты внутри каждого фильтра канал.

См. Также
http://academic.research.microsoft.com/Paper/201987.aspx?viewType=1

1 голос
/ 21 июня 2010

Если у вас нет оригинального аудио, это, вероятно, большая работа; это почти наверняка принципиально невозможно в абсолютном смысле, так как вы не можете сказать, какие особенности трека являются преднамеренными, а какие фальшивыми. Вы можете даже иметь кодировки из разных записей или миксов, и в этом случае простое сравнение в любом случае совершенно бессмысленно.

Таким образом, предполагая, что у вас нет оригинала, лучшее, что вы, вероятно, можете сделать, это эвристический подход - который, вероятно, будет работать довольно хорошо, но для его реализации потребуется много усилий.

  • Вложите капитал в некоторое программное обеспечение для обработки аудио и навыки; используйте это для создания программного обеспечения для выявления общих дефектов энкодера, эвристически основанных исключительно на выходе. Такими дефектами могут быть плохая временная локализация звуковых хитов (предположительно, большие окна в компрессии), высокая корреляция между левым и правым сигналами, ограниченный частотный диапазон и т. Д. (Человек с правильным опытом может, вероятно, перечислить десятки).
  • Оцените качество звука на каждой эвристике по некоторой скользящей шкале.
  • Используйте здравый смысл и столько времени + людей для тестирования, сколько вам нужно взвесить различные факторы для релевантности. Например, хотя может быть неплохо иметь частоту воспроизведения до 24 кГц, это не очень важно; с другой стороны отсутствие резкости может быть более раздражающим.

Если вам повезет, кто-то сделал работу до вас, потому что это звучит как дорогое предложение.

1 голос
/ 16 июня 2010

Я не слишком уверен в этом, но вот хорошее место для начала:

http://en.wikipedia.org/wiki/Signal-to-noise_ratio

Я не думаю, что вы можете рассчитать SNR по одному сигналу, но если у вас есть набор сигналов, вы могли бы рассчитать SNR, сравнивая их все.

В нижней части страницы есть несколько интересных ссылок, которые также могут предоставить некоторые интересные маршруты, если это невозможно.

Кроме того, я не звукоинженер, но я немного знаю об обработке сигналов, есть ли способ измерения уровней квантования в аудиосигналах? Возможно, на что-то посмотреть.

1 голос
/ 01 июня 2010

Я думаю, что ответ отрекается хорошо, если вы просто пытаетесь оценить набор параметров. К сожалению, вам также нужно определить функцию сравнения для оцененных вами параметров.

Что произойдет, если два компрессора применят полосовой фильтр с одинаково большими частотными диапазонами, но одно из них допускает более высокие частоты, чем другое. Один из них лучше? Какой?

Ответ, вероятно, зависит от того, какие частоты больше используются в файлах, с которыми вы работаете.

Объективной мерой было бы выяснить, какой файл потерял меньше энтропии . К сожалению, это нелегко сделать правильно.

...